Travaux – Antonio Soggia

Deep Learning pour le débruitage et la détection sonar 3D

Thèse de Doctorat • Deep Learning • Traitement du Signal • Mathématiques Appliquées

Recherche doctorale portant sur la détection de sources acoustiques sous-marines à très faible rapport signal-sur-bruit (SNR). L'objectif : concevoir des architectures capables de gérer l'explosion de données liée au passage des antennes 2D aux volumes 3D (gisement-élévation-temps).

1. Simulation et Ingénierie des Données

Développement d'un simulateur physique performant pour pallier le manque de données réelles annotées. Le moteur intègre les phénomènes de propagation, d'atténuation et de réflexions multiples pour générer des jeux de données synthétiques massifs.

2. Architecture AntoNet (2D & 3D)

Conception d'AntoNet, un CNN inspiré de U-Net, décliné en plusieurs versions pour le débruitage spatio-temporel.

Performances : Gains en détection atteignant 11 dB, frôlant la limite théorique de 12 dB du traitement incohérent.
Efficience : La version linéaire ne compte que 1.2k paramètres (contre 20.6M pour la non-linéaire), idéale pour l'embarqué.
État de l'art : Réduction de la MSE d'un facteur >10x par rapport aux modèles existants (DeepUnet, ORCA).

3. Analyse Mathématique et Interprétabilité

Étude analytique par régression symbolique permettant de caractériser la variété des minimiseurs globaux du réseau. Preuve que la dynamique d'apprentissage d'un réseau linéaire reste non-linéaire, offrant une robustesse accrue face au bruit gaussien.

Publications et Brevets
🏆 IPTA 2024 : Article classé Top-5. Version étendue en cours de révision pour le journal SPIC.
🎤 EUSIPCO 2025 : Publication sur les scénarios multi-trajets et la visualisation des cartes de caractéristiques.
📜 Brevet Déposé : Couvrant l'ensemble de la méthode, de la génération des signaux au pistage 3D.

Tech Stack :

Python PyTorch CUDA Signal Processing Math Modeling

Lire la suite ↓

Infrastructure LLM Auto-Hébergée & Serveur IA Privé

MLOps • Ingénierie Système • GenAI • Homelab

Conception et déploiement d'un serveur IA privé sous Linux pour l'exécution locale de modèles de langage (LLM). Cette infrastructure agit comme une alternative sécurisée, sans coût d'API, 100% respectueuse de la vie privée et accessible depuis n'importe où dans le monde.

1. Hardware & Inférence Multi-GPU

Le système repose sur un serveur Linux domestique headless équipé d'une configuration Multi-GPU (RTX 4070 + RTX 3060 12 Go). Gestion des contraintes de VRAM par la distribution des couches des modèles sur les deux cartes graphiques via CUDA, optimisant ainsi la vitesse d'inférence.

2. Optimisation et Quantification des Modèles

Déploiement d'architectures complexes via Ollama et llama.cpp. Application de techniques de quantification GGUF extrêmes (4-bit et 2-bit) pour faire tenir des modèles lourds (Llama, Gemma, MoE) dans une VRAM grand public.

3. Recherche Web Privée et Zéro-API

Afin de doter le LLM d'un accès internet en temps réel sans compromettre la confidentialité, j'ai intégré un moteur de recherche web auto-hébergé via Docker. Cela permet de réaliser des opérations de Web-Augmented Generation en s'affranchissant totalement des API commerciales externes (ex: API Google/Bing).

4. Interface et Réseau Zero-Trust (Tailscale)

Mise en place d'Open-WebUI pour offrir une interface utilisateur avancée. L'accès distant est sécurisé par Tailscale, créant un VPN Zero-Trust chiffré, permettant d'interroger le LLM local depuis un smartphone ou un PC portable en toute sécurité.

Réalisations Clés
Gestion efficace de la mémoire Multi-GPU.
Intégration d'un moteur de recherche web 100% local (Zéro-API).
Création d'un assistant IA mondial, always-on et strictement privé.

Tech Stack :

Serveur Linux Ollama / llama.cpp CUDA / Multi-GPU Self-Hosted Web Search Open-WebUI Tailscale (VPN) Docker

Lire la suite ↓

App de détection de troubles de la parole

Machine Learning • Audio

Pipeline complet de traitement audio (spectrogrammes + CNN/RNN) avec déploiement d’inférence embarquée.

Plateforme Full-Stack de Traduction Technique (API DeepL)

Développement Web • Flask • API REST • Administration Serveur

Développement d'une application web auto-hébergée permettant de traduire des documents techniques tout en préservant leur mise en page. L'application intègre l'API DeepL couplée à un gestionnaire avancé de glossaires personnalisés, résolvant ainsi le problème des traductions génériques dans les domaines spécialisés.

Architecture Backend & Base de Données

Backend conçu en Python/Flask avec système d'authentification par session. Implémentation d'une gestion dynamique de bases de données SQLite multiples (classées par paires de langues, ex. FR-EN) pour stocker et forcer l'utilisation d'une terminologie métier stricte lors de la traduction.

API REST & Déploiement

Conception d'endpoints RESTful pour les opérations CRUD, permettant à l'interface de gérer le dictionnaire de manière asynchrone. L'ensemble de l'infrastructure tourne sur un serveur Linux personnel, administré à distance via SSH, garantissant la confidentialité absolue des données.

Tech Stack :

Python / Flask SQLite API DeepL API REST HTML / JS Linux / SSH

Travaux & Projets

Deep Learning pour le débruitage et la détection sonar 3D

Infrastructure LLM Auto-Hébergée & Serveur IA Privé

App de détection de troubles de la parole

Plateforme Full-Stack de Traduction Technique (API DeepL)