Wireshark LLM LoRA QLoRA Python Orange

LLM Network Analysis

Fine-tuning de LLMs pour l'analyse automatique de traces réseau Wireshark — projet réalisé en alternance chez Orange.

Contexte

Dans le cadre de mon alternance chez Orange (Lannion), j'ai travaillé sur l'exploitation des modèles de langage pour analyser automatiquement des captures réseau. Les traces Wireshark représentent des volumes massifs de données difficiles à interpréter manuellement — l'objectif était d'automatiser cette analyse grâce aux LLMs.

[Complète ici avec le contexte spécifique — équipe, enjeux business, contraintes de confidentialité éventuelles…]

Stack technique

Python Backend / logique métier

HuggingFace Modèles & fine-tuning

LoRA / QLoRA Fine-tuning efficace

Wireshark / tshark Capture & export PCAP

PyTorch Entraînement des modèles

Docker Conteneurisation

Approche & Méthode

La démarche s'est articulée en plusieurs phases :

Extraction et prétraitement des traces réseau depuis les fichiers PCAP (tshark → JSON structuré).
Construction d'un dataset d'entraînement à partir des traces annotées.
Fine-tuning d'un LLM de base via LoRA/QLoRA pour spécialiser le modèle sur l'analyse réseau télécom.
Évaluation des performances du modèle affiné vs. modèle de base sur les tâches d'analyse.
[Complète avec tes étapes spécifiques…]

Résultats & Points clés

[XX]%

Amélioration vs. base

[XX]k

Échantillons d'entraînement

[XX]B

Paramètres du modèle

[Résultat clé 1 — ex : score sur benchmark, gain de précision…]
[Résultat clé 2 — ex : réduction du temps d'analyse, cas d'usage validés…]
[Résultat clé 3 — ex : limites identifiées, perspectives…]