Как писать и редактировать код с нейросетью DeepSeek Coder V2
Что за DeepSeek
Это китайский стартап, который появился в 2023 году и с двух ног влетел в тусовку больших языковых нейросетей с целым семейством моделей DeepSeek, которые специализируются на кодинге, математике и рассуждениях. Грубо говоря, это как если бы GPT от OpenAI выбрала быть технарём. У нейросети есть несколько вариантов.
- DeepSeek V2.5 — большая языковая модель с открытым исходным кодом, которую можно считать конкурентом GPT-4, LLaMA3-70B и Mixtral 8x22B. На момент публикации этого текста V2.5 — самая актуальная версия. Поддерживает контекст длиной до 128 тысяч знаков.
- DeepSeek Coder V2 — актуальная версия модели DeepSeek, заточенной под написание кода. Использует мультиэкспертную архитектуру MoE (Mixture of Experts), которая позволяет разбивать сложную задачу на несколько простых и решать их параллельно. В отличие от той же Mixtral, её не обучали с нуля, а получили путём слияния нескольких предварительно обученных версий DeepSeek. Coder V2 входит в DeepSeek V2.5, до этой версии модели существовали по отдельности.
- DeepSeek Math — модель для работы с математическими задачами. Отдельно обычно не используется, входит в DeepSeek Coder версии V1.5 и выше.
- DeepSeek VL — модель, которая считывает, что изображено на картинке, и выдаёт текстовое описание. Она способна учитывать надписи, диаграммы и прочий текст на естественном языке. Сама по себе мало кому будет полезна, зато как помощь другой нейронке в определении, что на присланной пользователем картинке, — вполне.
Говоря о написании кода, обращать внимание стоит на первые две модели.
Где попробовать DeepSeek
Есть несколько вариантов запустить нейросеть.
Официальный сайт
Самый простой вариант — чат-бот на официальном сайте. Получить доступ просто: перейдите на страницу DeepSeek, нажмите Start Now и авторизуйтесь через почту или Google-аккаунт.
Сразу после этого откроется окно чат-бота. Всё работает на DeepSeek V2.5 с разделением на две её ипостаси: универсального ассистента и помощника с кодом. На самом деле распределение по двум чатам довольно условное, ведь оба могут и править код, и подбирать рецепты на ужин.
Это, скорее, способ отделить котлеты от мух, чтобы не забивать контекст информацией разной направленности. Чаты можно использовать параллельно, например обсуждать бытовые вопросы с DeepSeek, а рабочие — с Coder.
Единственное функциональное отличие чата Coder от обычного DeepSeek — возможность запускать HTML-код прямо из бота: открывается всплывающее окно, в котором можно проверить, что получилось у нейросети.
Исходно бот пишет на английском, но если написать запрос на другом языке, то он тут же переключится. С русским это тоже работает.
Запросы к DeepSeek можно писать, следуя всем канонам промптинга ChatGPT: разбивать сложные вопросы на цепочку более простых последовательных, давать примеры и контекст. Кстати, о контексте: бот держит в памяти 4 096 токенов (каждый токен — примерно 3–5 знаков), так что ему можно скормить солидный кусок кода, прежде чем просить рекомендации.
Бот поможет дополнить код, найти и исправить ошибки, а также улучшить и упростить уже написанное. DeepSeek Coder V2 понимает 338 языков программирования, так что писать можно практически на чём угодно.
Другие варианты
Если по какой-то причине сайт не подходит, есть ещё несколько вариантов доступа к DeepSeek Coder.
- Установка на компьютер. Файлы и инструкция есть на GitHub разработчиков: предлагаются полноценная модель Coder V2 и облегчённый вариант Lite. Обе — с двумя вариантами ведения переписки (Base и Instruct), но отличаются количеством параметров: 16B в Lite и 256B в стандартной (B — это миллиарды). Старшая модель, что ожидаемо, прожорлива: в системных требованиях указывается 8 × 80 GPU, так что для личного использования подходит только Lite.
- Запуск на удалённом компьютере через Hugging Face. Доступны две версии DeepSeek Coder: 7B и 33B. Число указывает на количество миллиардов параметров, оба варианта относятся к первому поколению модели. Также в таком режиме можно попробовать DeepSeek VL. Для запуска откройте страницу DeepSeek на Hugging Face и выберите нужную модель в разделе Spaces. Работать всё будет ощутимо медленнее, чем при локальной установке и через чат-бот на сайте.
- Использование через API. В таком случае обработка запросов будет производиться на мощностях DeepSeek, а контекст увеличивается до 128 тысяч символов. Для создания собственного чат-бота или интеграции в проект нужно получить ключ на DeepSeek Platform и установить необходимые библиотеки. Поддерживается интеграция в популярные программы и расширения, в том числе в VS Code.
Сколько это стоит
Чат-ботом DeepSeek можно пользоваться полностью бесплатно и без ограничений, локальный запуск модели DeepSeek Coder V2 тоже бесплатный. Причём речь как об исследовательском, так и о коммерческом применении.
Создатели просят деньги только при работе через API: от 1,4 до 14 центов за миллион токенов на ввод и 28 центов за миллион токенов на вывод. Токеном считается слово или его кусок, на которые модель разбивает запрос для дальнейшей обработки либо выводит в качестве ответа.
Для работы с API нужно пополнять баланс заранее. Сделать это можно через банковскую карту или PayPal, оплатить российскими картами не получится.
Лучшие предложения
Надо брать: USB‑концентратор Orico за 1 717 рублей
16 уютных худи и свитшотов, которые согреют зимой
Выгодно: робот‑пылесос Dreame D10 Plus за 23 431 рубль
Цена дня: смартфон realme Note 60 за 8 920 рублей
15 магазинов, в которые стоит заглянуть во время «чёрной пятницы»
Отборные скидки: выгодные предложения от AliExpress, Tefal, Lamoda и других магазинов
15 товаров со скидками, которые стоит купить во время «Чёрной пятницы» на AliExpress
12 необычных вариантов посуды, которая покоряет с первого взгляда
От NFC до биоэквайринга: 6 разработок, которые изменили финансовые привычки россиян
РекламаС широко раскрытыми глазами: главные причины не бояться лазерной коррекции зрения
Выгода до 1,4 миллиона рублей, быстрый переезд и ещё 3 причины купить квартиру в кварталах ПИК
РекламаКак рассчитать бюджет на ремонт, чтобы обойтись без лишних затрат