Dominio chiaro
AI Act, compliance e procedure interne per PMI italiane, con output orientati a supporto operativo.
LLora documenta una pipeline completa per AI proprietaria e controllabile: dataset JSONL curato, training QLoRA, checkpoint intermedi, adapter LoRA finale e lettura delle metriche.
Overview
LLora nasce per specializzare un modello compatto su contenuti normativi e operativi legati all'AI Act europeo. Il focus non è creare un modello general purpose, ma dimostrare un flusso realistico di adattamento di dominio.
Il valore del progetto sta nella tracciabilità: dataset, configurazione, metriche, checkpoint e adapter finale sono letti come parti di un sistema ML verificabile.
AI Act, compliance e procedure interne per PMI italiane, con output orientati a supporto operativo.
Base model Qwen2.5 1.5B in 4-bit, adapter LoRA separato e workflow replicabile anche in locale.
Challenge
Il problema non era solo addestrare un modello. Era costruire un perimetro informativo pulito, con esempi coerenti, risposte omogenee e un obiettivo di specializzazione credibile.
Solution
La soluzione usa QLoRA su modello quantizzato a 4-bit, rank 16, adapter leggero e checkpoint intermedi. Il best checkpoint viene individuato allo step 40, evitando di confondere ultimo step e miglior modello.
Technical stack
Il case study mette in evidenza progettazione ML, preparazione dati, training controllato e interpretazione delle metriche.
Modello compatto, instruction tuned e quantizzato, scelto per sperimentazione efficiente e riuso locale.
Record instruction/output con split 40/10, risposte mediamente vicine a 100 parole e struttura omogenea.
Fine tuning efficiente senza riaddestrare tutto il modello base, con LoRA alpha 16 e dropout 0.
Batch effettivo 4, 5 epoche, learning rate 0,0002, warmup breve e scheduler lineare.
Best eval loss allo step 40, con lettura critica del plateau finale e del generalization gap.
Output riusabile tramite PEFT, checkpoint intermedi e reporting tecnico pronto per revisione.
Impact
LLora mostra capacità di progettare un workflow LLM applicato: dati, metodo, training, metriche e documentazione tecnica. Il risultato è una demo operativa credibile, non un claim generico sull'intelligenza artificiale.
CTA
LLora posiziona ZenkeiX come studio capace di costruire e documentare workflow LLM applicati: dal dataset all'addestramento, fino alla valutazione tecnica e al riuso degli artifact.
Seleziona le categorie che desideri abilitare. I cookie tecnici sono sempre attivi.