Квантизация LLM: Как сделать большие модели доступными каждому Новое
8 мин

Квантизация LLM: Как сделать большие модели доступными каждому

Подробный разбор квантизации больших языковых моделей — методы, форматы, MoE-архитектура и практические примеры с GPTQ, AWQ и llama.cpp.

Читать далее