Мои мысли, заметки и статьи на разные темы
Подробный разбор квантизации больших языковых моделей — методы, форматы, MoE-архитектура и практические примеры с GPTQ, AWQ и llama.cpp.