Когда я первый раз делал RAG для рабочей задачи, я честно повёлся на хайп: завёл Pinecone, написал склейки с OpenAI, прикрутил LangChain. Через две недели полез отлаживать, понял, что половину кода…
В прошлом году у нас на проекте встал вопрос — заменить часть функций OpenAI на российский LLM-API, чтобы не зависеть от валютных платежей и санкционных рисков. Мы попробовали YandexGPT и GigaChat, в…
Полгода назад я собирал домашний рабочий ПК специально под локальные LLM. Бюджет — 200к рублей, потолок гибкий. Перерыл форумы, бенчмарки, сравнил три варианта на руках. В этой статье — что я понял…
На Mac mini M3 Pro с 36 ГБ RAM я гоняю локальные модели уже год. Сначала через Ollama, потом параллельно поставил LM Studio, потом полгода жил на двух одновременно. В этой статье — честное сравнение…