Fine-tuning de LLMs pour l'analyse automatique de traces réseau Wireshark — projet réalisé en alternance chez Orange.
Contexte
Dans le cadre de mon alternance chez Orange (Lannion), j'ai travaillé sur l'exploitation des modèles de langage pour analyser automatiquement des captures réseau. Les traces Wireshark représentent des volumes massifs de données difficiles à interpréter manuellement — l'objectif était d'automatiser cette analyse grâce aux LLMs.
[Complète ici avec le contexte spécifique — équipe, enjeux business, contraintes de confidentialité éventuelles…]
Stack technique
PythonBackend / logique métier
HuggingFaceModèles & fine-tuning
LoRA / QLoRAFine-tuning efficace
Wireshark / tsharkCapture & export PCAP
PyTorchEntraînement des modèles
DockerConteneurisation
Approche & Méthode
La démarche s'est articulée en plusieurs phases :
Extraction et prétraitement des traces réseau depuis les fichiers PCAP (tshark → JSON structuré).
Construction d'un dataset d'entraînement à partir des traces annotées.
Fine-tuning d'un LLM de base via LoRA/QLoRA pour spécialiser le modèle sur l'analyse réseau télécom.
Évaluation des performances du modèle affiné vs. modèle de base sur les tâches d'analyse.
[Complète avec tes étapes spécifiques…]
Résultats & Points clés
[XX]%
Amélioration vs. base
[XX]k
Échantillons d'entraînement
[XX]B
Paramètres du modèle
[Résultat clé 1 — ex : score sur benchmark, gain de précision…]
[Résultat clé 2 — ex : réduction du temps d'analyse, cas d'usage validés…]
[Résultat clé 3 — ex : limites identifiées, perspectives…]