0) The spelled-out intro to neural networks and backpropagation: building micrograd45просмотров10 месяцев назад
Tülu 3 от AI2: полный рецепт тонкой настройки LLM с открытым исходным кодом4просмотра10 месяцев назад
Интуитивное объяснение проксимальной оптимизации политики (PPO) для больших языковых моделей11просмотров10 месяцев назад
GRPO (групповая относительная оптимизация политики) от DeepSeek | Обучение с подкреплением для LLM15просмотров10 месяцев назад
Объяснение Llama 4: Архитектура, длинный контекст и встроенная мультимодальность8просмотров10 месяцев назад
Как большие языковые модели выживают при низкой точности | Основы квантования5просмотров10 месяцев назад