Scorri per esplorare
Chi Sono

Andrea Alberti
GenAI Engineer & Data Scientist
Laureato con un doppio titolo in Ingegneria Gestionale e Informatica–Data Science, ho acquisito una sostanziale esperienza in progetti multidisciplinari. Mi specializzo nell'applicare tecniche di machine learning, deep learning e, più recentemente, Generative AI per sviluppare soluzioni innovative e automatizzate.
Il mio percorso accademico, dall'Ingegneria Gestionale (110/110 e lode) a una Magistrale in Data Science (110/110 e lode), mi ha dato un mix di competenza tecnica e pensiero strategico. Questo mi permette di affrontare problemi complessi sia da una prospettiva business che tecnologica.
Professionalmente, mi concentro sulla costruzione di sistemi intelligenti—dalle architetture multi-agente che automatizzano processi aziendali complessi all'AI conversazionale avanzata—per aumentare l'efficienza e ridurre i costi operativi. Il mio obiettivo è migliorarmi continuamente, usando l'AI per creare valore tangibile.
Magistrale Data Science - Ingegneria Informatica
Università di Pavia
Triennale Ingegneria Gestionale
Università di Brescia
Certificazione
Google Cloud Professional ML Engineer
Google Cloud
Competenze Tecniche
Competenze Core
Strumenti AI
Cloud & Infrastruttura
Linguaggi di Programmazione
Framework & Librerie
Progetti Professionali
Una selezione di progetti professionali dove ho applicato Generative AI e Machine Learning per risolvere problemi reali.
Assistente AI per Selezione Pneumatici
Perfezionamento e test di un agente conversazionale Dialogflow CX per il mercato UK, che guida gli utenti nella selezione di pneumatici tramite sistema multi-agente con RAG e API esterne. Migrazione con successo della soluzione a Google Agent Development Kit (ADK), espandendo a mercati internazionali e nuove categorie di veicoli con integrazione cross-cloud AWS-GCP.
Sistema Automatizzato di Validazione Documenti
Implementazione full-stack di un sistema multi-agente per automatizzare verifica e validazione documenti per richieste di finanziamento pubblico. Sviluppo backend in Python e frontend in HTML, CSS e JavaScript. Progettata architettura modulare e flessibile che permette adattamento del comportamento degli agenti senza modifiche al codice.
Chatbot Avanzato su Knowledge Base
Implementazione architettura avanzata di agente chatbot per rispondere a domande utenti usando knowledge base di pagine web e documenti PDF. Sistema progettato con agente orchestratore principale che instrada richieste a cinque sotto-agenti specializzati. Sviluppo pipeline gestione dati con parsing PDF, strategia chunking e layer sicurezza per domande inappropriate.
Agente Multimodale in Tempo Reale
Sviluppo e implementazione agente conversazionale multimodale in tempo reale basato su Google Agent Development Kit (ADK). Sistema capace di processare input audio e video simultaneamente, sostenere conversazioni fluide ed eseguire autonomamente operazioni su browser tramite reasoning e tool. Architettura asincrona dual-server con comunicazione WebSocket per streaming bidirezionale a bassa latenza.
Assistente Virtuale per Yacht di Lusso
Implementazione assistente virtuale con obiettivo di rispondere a domande utenti basate su knowledge base aziendale. Configurato come applicazione RAG (Retrieval-Augmented Generation), sfruttando Google Cloud ADK e Vertex AI Search per recuperare informazioni rilevanti da datastore dedicato. Architettura usa modelli Gemini per processare richieste e generare risposte accurate e contestualizzate in italiano.
Sistema Ticketing Multi-Agente
Implementazione sistema ticketing multi-agente per automatizzare risposte utenti. Progetto sviluppato come Proof of Concept (POC), coinvolgendo creazione agenti specializzati, ciascuno capace di interagire con database esterni via API per fornire risposte accurate e complete. Architettura multi-agente assicura che richieste utenti siano instradate all'agente più competente, riducendo carico lavoro staff e costi gestione.
Pipeline Classificazione Email Basata su LLM
All'interno progetto più ampio mirato ad automatizzare processo manuale e ridurre costi operativi, contributo focalizzato su creazione pipeline basata su LLM per classificazione e smistamento email certificate (PEC). Attività chiave includono prompt engineering e few-shot learning per raffinare output modelli, insieme a sviluppo metriche e strumenti analitici per valutazione performance sistema.
Motore Liquidazione Assicurativa - Progetto Demo
Sviluppo architettura collaborativa multi-agente completa per dimostrazione Sharing Days interno. Sistema analizza automaticamente, processa ed emette giudizi di liquidabilità su pratiche assicurative. Architettura combina agenti paralleli per analisi documenti con agenti sequenziali per valutazione finale, utilizzando tool custom, servizi Google Cloud built-in e integrazione MCP.
Ricerca & Lavoro Accademico

Rilevamento Malattie Cardiache da Segnali Audio
Machine Learning Biomedico Avanzato
Progettati ensemble per la prevenzione e il supporto clinico dello screening cardiaco sul Dangerous Heartbeat Dataset (CHSC2011). I toni cardiaci sono stati ricampionati a 4 kHz, suddivisi in finestre da 1 secondo, descritti con MFCC, cromagrammi, descrittori spettrali e temporali e ridotti da 338 a 41 feature tramite filtri basati su Spearman. L’ensemble di prevenzione limita i falsi negativi (ROC-AUC 0.96, TPR 43.4% a 1% FPR) mentre l’ensemble diagnostico a cinque classi raggiunge macro F1 81.6 con analisi di rischio per classe e spiegazioni SHAP.

Predizione Malattie con Graph Machine Learning
Data Science Finanziaria
Rappresentate 773 malattie e 377 sintomi in una rete bipartita per ingegnerizzare feature grafo-aware utili alla diagnosi. Method of Reflections, indici di Influenza di malattia/sintomo, rilevamento di comunità e betweenness centrality generano nuovi descrittori a complemento del one-hot dei sintomi. Sono stati confrontati modelli di Regressione Logistica, Random Forest e MLP; il modello logistico migliore eguaglia la baseline basata sui soli sintomi usando meno input e fornendo insight sull’accuratezza per classe.

Predizione Utilità Recensioni con Big Data
Data Science & Big Data Analytics
Analizzati circa 3 milioni di recensioni di libri Amazon con uno stack big data (HDFS, Spark, MongoDB) per spiegare e predire l’utilità percepita. I test d’ipotesi hanno quantificato l’impatto di lunghezza, sentiment e valutazione in stelle, mentre embedding Word2Vec hanno alimentato regressori Random Forest, SVR e MLP. Il miglior Random Forest ha ottenuto MSE 0.0259 (RMSE 0.1609, R² 0.253).

Rilevamento Clickbait in Titoli di Notizie
Machine Learning
Confrontati Multinomial Naive Bayes e Regressione Logistica su 32 mila titoli bilanciati per rilevare il clickbait. Sono stati esplorati due obiettivi: massima accuratezza (97.12% sul test con stopword e vocabolario da 8k) e assenza di falsi positivi (0% FPR, accuratezza 84%, TPR 68%). Un’analisi puntuale degli errori evidenzia le parole più impattanti e i trade-off introdotti dalla calibrazione del bias.

Rilevamento e Mitigazione Attacchi DDoS
Infrastruttura Digitale d'Impresa
Ricreati attacchi di riflessione e amplificazione DNS in una LAN controllata per misurare fattori di amplificazione, latenza sul bersaglio e risorse del server. Script Scapy personalizzati hanno effettuato spoofing del bersaglio variando i tipi di query (A, MX, NS, ANY) tra 10k e 50k pacchetti/s. Lo studio documenta latenza oltre 100 ms per le richieste ANY, saturazione della CPU durante gli attacchi intensificati e valuta contromisure.

Analisi Features per Classificazione Torte
Machine Learning
Confrontati descrittori hand-crafted e feature derivate da CNN per classificare 15 categorie di torte (1.800 immagini). Le statistiche di basso livello (istogramma dei colori, direzione dei bordi, matrice di co-occorrenza) alimentavano un MLP ma si sono fermate al 31% di accuratezza, mentre le mappe di PVMLNet (layer −5) abbinate a un MLP hanno raggiunto il 90% sul test. Il transfer learning con PVMLNet fine-tunata si è fermato all’80%, evidenziando il valore delle rappresentazioni profonde.

Rilevamento Punti di Fuga nelle Immagini
Computer Vision
Realizzate due utilità di computer vision: (1) uno strumento di binarizzazione guidato dall'istogramma con tuning auto/manuale e GUI, e (2) un rilevatore di punti di fuga che combina Canny, Hough probabilistico e RANSAC (500 iterazioni, tolleranza 5 px). La pipeline adatta le soglie alle statistiche dell'immagine, sovrappone le 15 linee più significative e documenta confronti SSIM con Otsu.

Analisi del Sentimento sui Social Media
Machine Learning
Implementati classificatori di sentiment sul dataset IMDb (50k recensioni) confrontando Naive Bayes Multinomiale e Regressione Logistica. Sono stati analizzati dimensione del vocabolario, rimozione di stopword e stemming per bilanciare accuratezza e overfitting. Naive Bayes con stopword (vocabolario 1k) ha raggiunto l’82.6% sul test, mentre la Regressione Logistica è arrivata all’85.4% con tuning minimo.
Demo AI Interattive
Esplora le capacità dell'AI attraverso dimostrazioni interattive. Da strumenti di ricerca basati su RAG a sistemi multi-agente autonomi.
Esploratore di Paper
Chatta con i miei paper accademici usando RAG. Fai domande sulla mia ricerca in ML, DL, NLP e Computer Vision.
Consiglio di Amministrazione AI
Sistema multi-agente che simula un consiglio di esperti. Osserva gli agenti dibattere e raggiungere un consenso su decisioni strategiche.
Assistente di Ricerca Autonomo
Agente AI con strumenti per ricerca web, analisi dati e generazione report. Dimostra flussi di lavoro agentici e uso di strumenti.
Un Luogo Unico per Tutto
Learn Different, Think Different, Choose Liberti Hub
Oltre il Lavoro
Altre cose che amo fare

Corpo Attivo, Mente Attiva
È importante per me avere momenti per prendermi cura della mia salute. Ho allestito una piccola palestra a casa e amo anche giocare a tennis e calcio.

Il Mix Perfetto di Passione, Abilità e Strategia
Amo la Formula 1 perché rappresenta l'apice delle corse, combinando tecnologia all'avanguardia con abilità umana e pensiero strategico.
Se non vai più per un varco che esiste, non sei più un pilota da corsa. — Ayrton Senna

Una Tradizione di Famiglia Duratura
Ho ereditato da mio nonno la passione per il calcio e per il tennis. Amo guardare e analizzare le partite e sono un grande tifoso del Milan da sempre.
Connettiamoci
Aperto a opportunità e collaborazioni. Sentiti libero di contattarmi!
Connettiamoci
Aperto a opportunità e collaborazioni
