Наткнулся в Твиттере на шикарную визуализацию LLM. Как выяснилось, ей уже целый год, но для новичков это все ещё полезная штука. Кроме красивой 3D-модельки, здесь еще подробный гайд по работе каждого элемента, как говорит автор, до каждого “сложить и умножить“. По архитектурам там есть GPT-2, nanoGPT, GPT-2 XL, ну и GPT-3. Ссылочка на визуализацию
Hide player controls
Hide resume playing