Cosa c’è di nuovo
L’ultimo video di @3blue1brown su YouTube approfondisce il meccanismo di attenzione dei transformers. Spiega come il modello rappresenta i token come vettori e come questi vettori acquisiscono significato dal contesto. 

Questo episodio si concentra sugli aspetti tecnici del meccanismo di attenzione nell’architettura del transformer.

Altri video :

Cosa e’ un CHATGPT

Cosa e’ una rete Neurale