Nel mare magnum di buzzword e promesse roboanti su intelligenze artificiali miracolose, c’è una verità brutale che raramente viene sussurrata nei corridoi dorati delle startup e degli incubatori di unicorni: la parte più sottovalutata nello sviluppo di AI è conoscere davvero le strutture dati. Senza questo mattoncino di base, puoi anche avere il miglior modello del mondo, il cloud più costoso e una pipeline MLOps degna di un film cyberpunk: tutto crollerà come un castello di carte in una giornata ventosa a Chicago.
Capire come i dati sono organizzati, memorizzati e recuperati non è un vezzo accademico da nerd occhialuti chiusi in qualche scantinato, è la differenza tra un sistema AI scalabile e una montagna fumante di bug ingestibili. Ed è esattamente per questo che ogni maledetta app, da ChatGPT fino alla Tesla che cerca disperatamente di non investire il tuo gatto, usa strutture dati pensate, ottimizzate e brutalmente efficienti.
Quando scorri il feed su Twitter, non stai assistendo a un miracolo digitale, ma a una lista ben orchestrata. Ogni tweet è collegato sequenzialmente, come perle in una collana programmata per non strangolarti a metà scorrimento. Allo stesso modo, se lanci un’operazione matematica su un foglio Excel o su un dataset di milioni di immagini per addestrare un modello, dietro c’è un umile, infaticabile array che permette un accesso rapido ai dati.
Ora, se mai ti è capitato di battere un pugno sulla scrivania dopo aver accidentalmente cancellato mezza presentazione in PowerPoint, devi ringraziare uno stack. Ogni volta che premi “undo”, il sistema non fa magie: segue semplicemente una pila logica di azioni registrate, dove l’ultima entrata è la prima a essere annullata. È il concetto di LIFO (Last In First Out) che salva più carriere di quanto vogliamo ammettere.
Se ti trovi in fila dal panettiere, stai vivendo un’esperienza spirituale con una queue. Prima dentro, prima fuori. La stessa cosa succede quando stampi un documento: il sistema non ti ama, semplicemente usa una coda.
Quando invece la priorità diventa una questione di sopravvivenza digitale, entrano in gioco i famigerati heap. Sono loro che decidono quale processo deve essere gestito prima dal tuo computer, o quale Uber ti raccatterà in mezzo al nulla mentre fingi di essere “a due minuti” dal luogo indicato.
Per ogni sito web che carichi senza bestemmiare, ringrazia un albero, o meglio una tree structure. Gli alberi sono fondamentali per organizzare contenuti, navigare in documenti HTML e prendere decisioni nei modelli AI, tipo riconoscere se nella foto che hai caricato c’è un gatto, un tostapane o un parente ubriaco.
Quando il problema non è solo navigare, ma cercare qualcosa nel mare di dati, servono i suffix tree. Queste bestioline algoritmiche ti permettono di trovare in tempo record una parola in un documento da milioni di caratteri. Praticamente l’equivalente digitale di cercare un ago in un pagliaio… e trovarlo.
Tutta la retorica sulle “connessioni umane” nei social media si basa su graph, i grafi. Non è poesia, sono modelli matematici brutali che mappano persone, luoghi e connessioni, come il GPS che ti guida mentre imprechi contro il traffico.
Quando cerchi “ristorante sushi vicino a me” e Google magicamente ti mostra l’oasi perfetta, devi ringraziare un R-Tree. È la struttura dati che rende possibile trovare cose nel mondo reale in modo rapido e preciso. E se sei a bordo di un’auto a guida autonoma, speri che il loro R-Tree sia ben ottimizzato, o finirai su un sentiero di montagna.
Infine, se vuoi accesso istantaneo a dati, servono hash table. Sono i ninja invisibili dietro cache di browser, lookup di password e persino il modo in cui ChatGPT si ricorda a chi diavolo sta parlando.
Il punto è chiaro e cinicamente semplice: senza strutture dati robuste, non esiste AI. Tutto il resto è fuffa da keynote motivazionali. Prima impari a padroneggiare questi strumenti invisibili, prima puoi costruire sistemi veramente scalabili. O almeno evitare di buttare milioni in server farm inutili.
Se vuoi approfondire, qui trovi un ottimo overview di ByteByteGo che riassume senza fronzoli tutta questa brutalità ingegneristica.

Dimmi, quale di queste strutture dati ti ha già tradito oggi?