Lavori – Antonio Soggia

Deep Learning per il Denoising e Rilevamento Sonar 3D

Ricerca di Dottorato • Deep Learning • DSP • Matematica Applicata

Ricerca di dottorato focalizzata sul rilevamento di sorgenti acustiche sottomarine a bassissimo rapporto segnale-rumore (SNR), gestendo la transizione dalle classiche antenne 2D alle rappresentazioni volumetriche 3D (azimut-elevazione-tempo).

1. Simulazione e Data Engineering

Sviluppo da zero di un simulatore fisico ad alte prestazioni per sopperire alla mancanza di dati reali etichettati. Il motore modella la propagazione, l'attenuazione e le riflessioni multiple, generando dataset sintetici massivi per l'addestramento.

2. Architettura AntoNet (2D & 3D)

Progettazione di AntoNet, una CNN custom ispirata a U-Net, declinata in varie versioni per il denoising spazio-temporale.

Performance: Guadagni in rilevamento fino a 11 dB, avvicinandosi al limite teorico di 12 dB del processamento incoerente.
Efficienza: La versione lineare richiede solo 1.2k parametri (contro i 20.6M della non-lineare), ideale per l'inferenza edge.
Stato dell'arte: Riduzione dell'Errore Quadratico Medio (MSE) di >10x rispetto alle architetture esistenti.

3. Analisi Matematica e Interpretabilità

Studio analitico tramite regressione simbolica per caratterizzare la varietà dei minimi globali della rete. È stato dimostrato che la dinamica di apprendimento della rete lineare è non-lineare, garantendo maggiore robustezza al rumore gaussiano.

Pubblicazioni e Brevetti
IPTA 2024: Articolo Top-5 sulle dinamiche di AntoNet. (In revisione per SPIC).
EUSIPCO 2025: Ricerca sugli scenari multi-path e visualizzazione feature map.
Brevetto: Copre l'intera pipeline, dalla generazione del segnale al tracciamento 3D.

Tech Stack:

Python PyTorch CUDA Signal Processing Math Modeling

Leggi di più ↓

Infrastruttura LLM Self-Hosted & AI Server Privato

MLOps • Systems Engineering • GenAI • Homelab

Progettazione e deployment di un server IA privato basato su Linux per l'esecuzione in locale di Large Language Models (LLM). L'infrastruttura funge da alternativa "privacy-first" e a costo zero alle API cloud, accessibile in modo sicuro da remoto in qualsiasi parte del mondo.

1. Hardware & Multi-GPU Inference

Il sistema è ospitato su un server Linux headless equipaggiato con una configurazione Multi-GPU (RTX 4070 + RTX 3060 12GB). Ho gestito i limiti fisici della VRAM distribuendo i layer dei modelli su entrambe le GPU tramite CUDA, massimizzando il throughput di inferenza.

2. Ottimizzazione e Quantizzazione Modelli

Deployment di architetture complesse tramite Ollama e llama.cpp, testando modelli densi (Llama, Gemma) e architetture Mixture of Experts (MoE). Per far rientrare modelli ad alto numero di parametri nella VRAM consumer, ho applicato tecniche di quantizzazione GGUF estreme (4-bit e 2-bit), bilanciando perdita di precisione e velocità di generazione.

3. Web Search Privato e Zero-API

Per dotare l'LLM di accesso a internet in tempo reale senza compromettere la privacy, ho integrato un motore di ricerca web self-hosted tramite Docker. Questo permette di eseguire pipeline di Web-Augmented Generation interrogando il web direttamente dalla mia infrastruttura, aggirando completamente la dipendenza da API commerciali esterne (es. Google/Bing API).

4. UI e Rete Zero-Trust (Tailscale)

Integrazione di Open-WebUI per avere un frontend avanzato con controllo granulare sui parametri di generazione. L'accesso remoto è garantito da Tailscale, che crea una VPN Zero-Trust crittografata, permettendomi di interrogare l'LLM da smartphone e laptop su reti pubbliche in totale sicurezza.

Risultati Chiave
Gestione efficiente della memoria Multi-GPU.
Integrazione di un motore di ricerca 100% locale (Zero-API).
Architettura Zero-Trust per un assistente IA globale, privato e always-on.

Tech Stack:

Linux Server Ollama / llama.cpp CUDA / Multi-GPU Self-Hosted Web Search Open-WebUI Tailscale (VPN) Docker

Leggi di più ↓

App rilevamento disturbi del linguaggio

Machine Learning • Audio

Pipeline completa per analisi audio con CNN/RNN e inferenza deployata.

Piattaforma Full-Stack per Traduzioni Tecniche (DeepL API)

Sviluppo Web • Flask • REST API • Server Administration

Sviluppo di un'applicazione web self-hosted per tradurre documenti tecnici preservandone il layout originale. L'app integra le API di DeepL con un sistema avanzato di gestione di glossari personalizzati, risolvendo il problema delle traduzioni generiche in ambiti altamente specialistici.

Architettura Backend e Database

Backend sviluppato in Python/Flask con sistema di autenticazione basato su sessioni. Ho ingegnerizzato una gestione dinamica di database SQLite multipli (organizzati automaticamente in cartelle per coppie di lingue, es. IT-ENG) per memorizzare e applicare glossari specifici durante l'inferenza della traduzione.

API REST e Deployment Server

Creazione di endpoint RESTful per le operazioni CRUD (Create, Read, Update, Delete) che permettono al frontend di gestire il glossario in modo asincrono. L'intera infrastruttura è ospitata su un server Linux personale, configurato e amministrato da remoto tramite SSH, garantendo totale controllo sui dati e abbattimento dei costi cloud.

Tech Stack:

Python / Flask SQLite DeepL API RESTful API HTML / JS Linux / SSH

Lavori e Progetti

Deep Learning per il Denoising e Rilevamento Sonar 3D

Infrastruttura LLM Self-Hosted & AI Server Privato

App rilevamento disturbi del linguaggio

Piattaforma Full-Stack per Traduzioni Tecniche (DeepL API)