Подключи Cline, Cursor или любой инструмент с OpenAI API к облачным моделям без GPU на своей стороне.
Ollama — это сервер для запуска AI-моделей. Обычно его устанавливают локально на компьютер. Здесь он работает на облачном сервере и раздаёт доступ к 16 облачным моделям и 1 локальной по стандартному API. Ты подключаешь свой редактор один раз — и сразу получаешь все модели.
Сгруппировано по задачам. Полные теги — используй как есть в настройках редактора.
MiniMax M3 — фронтирная модель для кода и агентных задач: нативная мультимодальность (понимает картинки), многошаговые рассуждения, вызов инструментов и автономная декомпозиция задач. Сверхдлинный контекст 512K токенов (до 1M в модели). На агентном бенчмарке BrowseComp (83.5) обгоняет Claude Opus 4.7 (79.3) — флагман списка.
Google Gemma 3 — 1B параметров, ~815 MB. Работает прямо на сервере, без выхода в облако. Скорость ~17 токенов/сек, ответ за 1-3 секунды. Для быстрых повседневных вопросов и простых задач.
В VS Code: нажми на иконку Cline → Provider Settings → выбери Ollama
Base URL: https://olla.mpa.ru.net
Cline подтянет список моделей автоматически. Для кода рекомендуем devstral-2:123b-cloud — мощная и точная, помнит большие проекты целиком.
Жми Save и используй Cline как обычно — только модели теперь облачные.
Settings → Models → Add Model → вставь адрес olla.mpa.ru.net как OpenAI-compatible base URL.
Замени api.openai.com на olla.mpa.ru.net. API-ключ не нужен — можно указать любую строку.
Если у тебя свой Open WebUI — добавь Ollama-соединение с адресом olla.mpa.ru.net в настройках Admin.
Сервер доступен по IP-вайтлисту. Напиши нам свой IP — добавим в течение дня.