Gestione archivi documentali: come fare ordine in 50 GB di file
Archivio aziendale disordinato? File con nomi casuali, cartelle doppie, documenti irreperibili? In questo articolo vediamo come fare una bonifica massiva su migliaia di file senza perdere nulla.
Apri Esplora Risorse e vedi: FATTURA_FINALE_v3_OKDAVVERO.pdf, Copia di Copia di contratto.docx, una cartella chiamata MISC2 con 800 file dentro, e una cartella ARCHIVIO_BACKUP_2019 che nessuno sa se contiene roba importante o no.
Questo è l’archivio documentale di migliaia di aziende italiane. Non perché i dipendenti siano disattenti — ma perché i file si accumulano, le convenzioni di naming cambiano nel tempo, i backup si sovrappongono, e nessuno ha mai avuto tempo di fare ordine.
Fino a quando il commercialista chiede un documento del 2021 e ci vuole un’ora per trovarlo.
Il problema ha un costo reale
Un’ora persa a cercare un file, per 5 dipendenti, per 250 giorni lavorativi all’anno, vale circa 4.000 ore aziendali. A €25/ora di costo medio del lavoro, fanno €100.000 l’anno spesi in ricerche di file.
Non è un problema di archiviazione — è un problema di produttività.
Come si affronta una bonifica archivio
Fase 1 — Scansione e analisi (dry-run)
Prima di spostare anche solo un file, lo script fa una scansione completa dell’archivio e produce un report:
Analisi archivio: /NAS_AZIENDALE/
───────────────────────────────────
File totali scansionati: 50.247
Duplicati rilevati: 6.831 (13.6%)
File senza estensione: 412
Nomi non conformi: 8.920 (17.7%)
Cartelle vuote: 143
Spazio recuperabile: 14.2 GB
Anteprima delle azioni proposte:
→ SPOSTA: /MISC2/fatt_2019_ok.pdf → /Fatture/2019/
→ RINOMINA: "documento finale.pdf" → "20190315_contratto_rossi.pdf"
→ ELIMINA candidato: "Copia di Copia di report.xlsx" (duplicato esatto)
Questo report viene approvato da te prima che venga mosso qualsiasi file. È il principio del dry-run: nessuna sorpresa.
Fase 2 — Definizione delle regole di naming
Ogni azienda ha le sue convenzioni. Prima di eseguire la bonifica, definiamo insieme:
- Struttura delle cartelle: come vuoi organizzare (per anno? per cliente? per tipo documento?)
- Convenzione di naming:
YYYYMMDD_tipo_cliente_versione.exto altro - Gestione duplicati: elimina sicuro, sposta in quarantena, o mantieni entrambi con suffisso?
- Esclusioni: quali cartelle non toccare mai (es.
/ARCHIVIO_STORICO_PRE2010/)
Fase 3 — Esecuzione con log completo
Quando le regole sono definite e il dry-run è approvato, lo script esegue le azioni e produce un log:
[2026-01-15 08:00:01] START — 50.247 file da processare
[2026-01-15 08:00:03] SPOSTA OK — fatt_2019_ok.pdf → Fatture/2019/
[2026-01-15 08:00:03] RINOMINA OK — documento finale.pdf → 20190315_contratto_rossi.pdf
[2026-01-15 08:02:41] SCARTO — file_sconosciuto.xyz: estensione non gestita → da revisionare manualmente
...
[2026-01-15 11:58:22] FINE — 50.021 OK, 226 scarti. Durata: 3h 58m
Il log è il tuo registro di audit: sai esattamente cosa è stato fatto, da chi (lo script), quando, e perché.
Il caso reale: 50.000 DDT in 4 ore
Un’azienda logistica aveva accumulato 8 anni di Documenti di Trasporto (DDT) in una struttura di cartelle senza nessuna logica. 50.000 file distribuiti in cartelle con nomi come DDT_OLD, BACKUP_NAS, TRANSFERITO_2022.
Trovare un DDT specifico richiedeva in media 20 minuti di ricerca. Gli audit periodici trimestrali richiedevano 2 settimane di lavoro manuale.
Risultato della bonifica:
- Durata totale: 4 ore (inclusa la fase di dry-run e approvazione)
- File riorganizzati: 50.000
- File persi: 0 — il log garantiva la tracciabilità completa
- Tempo di ricerca post-bonifica: < 30 secondi (ricerca per nome con struttura coerente)
Cosa non fare durante una bonifica
❌ Cancellare senza dry-run
Se uno script elimina file senza che tu abbia prima visto cosa sta per fare, stai giocando a Russian roulette con i tuoi dati. Un dry-run non è opzionale.
❌ Rinominare senza log
Senza un log, se dopo la bonifica manca un file, non sai dove è finito. Il log è la tua polizza assicurativa.
❌ Fare tutto in una volta senza test su un campione
Prima di applicare le regole all’intero archivio, si testa su 200–300 file campione. Si verifica il risultato. Si aggusta. Poi si scala.
Hai un archivio da riordinare?
Se hai un NAS aziendale, una cartella condivisa su Teams/SharePoint, o un server di file locale che è diventato ingestibile, possiamo aiutarti.
Il processo inizia sempre da un’analisi gratuita: ti diciamo quanti duplicati hai, quanto spazio potresti recuperare e quanto ci vorrebbe per fare ordine.