EasyByte
Статья

Фиксированная цена или Time & Material: какую модель оплаты выбрать при разработке нейросети на заказ.

11 марта 2026 ~5 мин
Фиксированная цена или Time & Material: какую модель оплаты выбрать при разработке нейросети на заказ.

Вся правда о Fix Price в разработке ИИ. Разбираем, как жесткая смета плодит костыли в архитектуре, сжигает бюджеты на GPU и приводит к утечкам по 152-ФЗ.

Опубликовано 11 марта 2026
Категория EasyByte Блог
Время чтения ~5 мин

Как сжечь 40 миллионов рублей на «гарантиях»

В российском энтерпрайзе есть одна неискоренимая, мазохистская традиция. Когда бизнесу нужен сложный технологический продукт, топ-менеджмент внезапно превращается в завсегдатаев восточного базара. Они хотят инноваций, хотят state-of-the-art архитектуру, генеративный ИИ и бесшовную интеграцию с легаси-системами, но при этом требуют, чтобы все это было завернуто в жесткий Fixed Price договор. С прописанными до запятой сроками, штрафными санкциями и фиксированной сметой.

Давайте будем честны: покупка заказной разработки нейросетей по модели Fix Price — это не контроль рисков. Это покупка билета на Титаник, где в стоимость уже включена персональная шлюпка для подрядчика и ледяная вода для вашего бюджета.

Буквально месяц назад нас позвали на аудит (читай: на эксгумацию) одного амбициозного AI-проекта в крупной российской FMCG-сети. Задача звучала благородно: корпоративный Copilot на базе LLM, обученный на внутренних регламентах, логах 1С и документации по продуктам. Интегратор-победитель тендера ударил по рукам на 40 000 000 ₽ и срок в 6 месяцев. В ТЗ были прописаны абстрактные «точность ответов не менее 95%» и «отсутствие галлюцинаций».

Спустя восемь месяцев заказчик получил не масштабируемую микросервисную архитектуру, а неповоротливого монолитного Франкенштейна. Система ложилась при пяти одновременных запросах, стоимость аренды GPU в облаке сжирала по миллиону рублей в месяц, а сама нейросеть радостно советовала сотрудникам увольняться, ссылаясь на выдуманные пункты Трудового кодекса.

Леночка скроллит JSON-ответы от провайдера, брезгливо морщась, пока ее пальцы выбивают дробь по механической клавиатуре. — «Смотри, они зашили системный промпт прямо в код контроллера, хардкодом. А вместо нормальной векторной базы для RAG подняли локальный SQLite с каким-то самописным костылем на Python для поиска по косинусному сходству. Знаешь, что будет, когда сюда придут хотя бы сто юзеров из их хваленого энтерпрайза? Эта богадельня ляжет быстрее, чем стажер успеет загуглить 'Out of Memory'. Зато по ТЗ всё сошлось — база есть, поиск есть. На бумаге они гении, в реальности — архитектурные террористы».

Именно здесь кроется фундаментальная проблема рынка заказной ИИ-разработки. Машинное обучение — это не разработка типового CRUD-приложения, где можно посчитать часы на верстку кнопок и написание API-эндпоинтов. Это недетерминированный процесс, чистый R&D, где результат напрямую зависит от качества ваших данных, которые на старте проекта не видел никто.


Анатомия Fixed Price в Machine Learning

Почему Fixed Price в AI-проектах — это всегда архитектурный компромисс, за который заплатит заказчик? Давайте заглянем под капот и разберем физику этого процесса.

Когда подрядчик подписывается под жесткой сметой на внедрение, например, системы Retrieval-Augmented Generation (RAG) или дообучение Open-Source модели (LLaMA 3, Qwen) под ваши задачи, он закладывает в бюджет риски. Обычно это х2 или х3 от реальной стоимости T&M. Но даже этого часто не хватает, потому что всплывают суровые реалии отечественного ландшафта.

1. Данные: Грязная тайна корпоративного IT

В ТЗ написано: «Использовать базу знаний компании». В реальности база знаний — это свалка из PDF-сканов 2018 года в кривой кодировке, битых таблиц Excel и Confluence-страниц, которые писали люди, давно покинувшие страну.

В модели T&M дата-инженеры и ML-специалисты тратят недели на EDA (Exploratory Data Analysis), очистку, парсинг, разработку сложных пайплайнов для векторизации. Они подбирают стратегии чанкинга (разбиения текста на куски), настраивают перекрытие токенов, экспериментируют с различными embedding-моделями (например, от Yandex Foundation Models или локально развернутыми sentence-transformers).

Что делает подрядчик на Fix Price, когда понимает, что бюджет на исходе? Он пишет простейший парсер, который проглатывает мусор «как есть», разбивает его тупо по 512 токенов без учета семантики и заливает в индекс. Результат: при запросе «Как оформить командировку?» RAG-система выдергивает кусок текста из меню корпоративной столовой и обрывок приказа об увольнении. LLM пытается это синтезировать и выдает шизофренический бред. Подрядчик разводит руками: «Модель работает, данные ваши. Подписывайте акт».

2. Vendor Lock-in и экономия на инфраструктуре

В российских реалиях мы завязаны на отечественные облака (Yandex Cloud, Selectel, Cloud.ru) или суровый on-premise. Стоимость аренды инстансов с GPU (A100, V100) исчисляется сотнями тысяч рублей.

Леночка выводит на второй монитор дашборды Grafana с метриками утилизации железа. — «Vendor lock-in во всей его уродливой красе. Подрядчик зафиксировал смету, поэтому взял самую дешевую vLLM-сборку без квантования (ни тебе AWQ, ни GGUF) и посадил ее на виртуальную машину без малейшего запаса по VRAM. Чтобы этот кусок кода не падал с OOM (Out of Memory) каждую минуту, они просто жестко обрезали контекстное окно модели до 2000 токенов. Блестяще. Они продали вам калькулятор по цене суперкомпьютера, и теперь ваша нейросеть страдает амнезией прямо посреди диалога».

В парадигме Fixed Price у вендора нет мотивации строить масштабируемую MLOps-инфраструктуру. Зачем разворачивать Kubernetes, настраивать CI/CD для ML-моделей (через Kubeflow или MLflow), писать автотесты для оценки дрифта данных? Это съест их маржу. Вам отдадут Docker-контейнер, который собран «на коленке» и работает только при идеальной погоде и фазе луны. Любое масштабирование потребует полного переписывания архитектуры.


Бизнес-импакт: Цена иллюзий в рублевом эквиваленте

Многие CTO и IT-директора выбирают Fix Price, чтобы «защитить бюджет перед бордом». Но давайте посчитаем реальную стоимость такого самоуспокоения.

Скрытый технический долг: Вы получаете систему, которая не может эволюционировать. Захотели добавить новый источник данных? Сменить провайдера LLM с OpenAI на YandexGPT из-за требований безопасности? В жесткой архитектуре, написанной под фиксированный бюджет, это невозможно. Вам выставят новый счет на "доработку", который превысит изначальную смету.

Информационная безопасность и комплаенс (152-ФЗ): Это самая сочная часть марлезонского балета. ИИ, интегрированный в бизнес, требует жесточайшего контроля доступов (RBAC) на уровне векторного поиска.

Леночка сухо стучит по клавиатуре, вытягивая логи доступа через Kibana. В ее голосе звенит арктический холод. — «Вы хотели гарантий бюджета, вы их получили. Только вот в ТЗ юристы забыли прописать ролевую модель фильтрации метаданных в векторном хранилище. И теперь ваша свежая, инновационная LLM радостно пересказывает линейному менеджеру из отдела продаж содержимое зарплатной ведомости генерального директора. Почему? Да потому что чанки из 1С и секретные приказы свалили в единый индекс без тегирования доступов. Готовьте вазелин и PR-отдел, утечка уже пошла по телеграм-каналам. 152-ФЗ передает пламенный привет».

Когда вы экономите на гибкости разработки, вы экономите на безопасности. Интегратор на Fix Price не будет внедрять сложные guardrails (системы фильтрации промптов и ответов), проверять LLM на prompt injection атаки или настраивать маскирование ПДН перед отправкой в облако. Это не вписывается в смету. В итоге, штрафы от Роскомнадзора, репутационные потери и иски от клиентов обойдутся бизнесу в десятки раз дороже, чем честная оплата часов сеньор-инженеров.


Time & Material: Парадигма технологического прагматизма

Как избежать катастрофы? Признать, что разработка ИИ — это путь, а не готовая коробка. Модель Time & Material (T&M) или гибридные подходы (Fix Price на фазу Discovery + T&M на реализацию) — это единственный способ получить работающий, безопасный и масштабируемый продукт.

В EasyByte мы пропагандируем жесткий технологический прагматизм. Что вы покупаете при модели T&M?

  1. Прозрачность гипотез: Мы не обещаем 99% точности до того, как увидим данные. Мы берем спринт, чистим срез данных, тюним embedding-модель, тестируем гибридный поиск (Semantic + Keyword search) и показываем реальные метрики (NDCG, MRR).

  2. Адаптивная архитектура: Если в процессе выясняется, что Open-Source модель не тянет сложный reasoning на русском языке, мы мгновенно меняем архитектурный подход. Переходим на агентов (AI Agents), подключаем внешние инструменты (Tool calling) через API, внедряем пайплайны с Re-ranker'ами (например, BGE-Reranker).

  3. Enterprise-grade безопасность: Мы закладываем время на интеграцию с вашим Active Directory/Keycloak. Мы пишем intent-first классификаторы, которые отбивают попытки вытащить из модели коммерческую тайну еще до того, как запрос попадет в ядро LLM.

  4. MLOps и Observability: Вы получаете не бинарник, а конвейер. Метрики качества ответов, логирование промптов, алерты на аномальное потребление токенов — всё это собирается в единую панель мониторинга.

T&M — это партнерство. Вы платите за прозрачный инженерный процесс, где на каждом этапе можете скорректировать курс, опираясь на реальные данные, а не на фантазии из ТЗ годовой давности.

Леночка закрывает терминал, откидывается в кресле и устало трет переносицу. — «Сносим. Всё до основания. Разворачиваем Managed Kubernetes в Selectel, ставим нормальный кластерный Milvus, оркестрируем потоки через кастомные цепочки, а не этот мусорный спагетти-код на LangChain. И никаких 'мы сделаем всё за месяц'. Первая неделя уйдет только на то, чтобы отмыть ваш датасет от исторической грязи. Хотите сказок про всемогущий ИИ по фиксированной цене — идите к инфоцыганам. Хотите рабочий, отказоустойчивый продукт, за который не стыдно перед инвесторами — платите за часы квалифицированных инженеров».


Иллюзия дешевизны

Попытка загнать AI-разработку в рамки Fixed Price — это как попытка зафиксировать стоимость лечения сложного заболевания до сдачи анализов. Вам либо продадут плацебо по цене антибиотиков, либо ампутируют ногу, потому что "хирургия в бюджет не влезла".

Российский энтерпрайз постепенно взрослеет. CTO начинают понимать, что стоимость ошибки в архитектуре нейросети — это не просто выкинутые деньги на разработку. Это слитые данные клиентов, парализованные бизнес-процессы и сожженная инфраструктура.

Если вы хотите внедрить ИИ так, чтобы он приносил прибыль, а не седые волосы — выбирайте команды, которые не боятся сказать вам правду о качестве ваших данных и не прячут архитектурные костыли за фиксированной сметой. Выбирайте инженерный подход, прозрачный MLOps и глубокую экспертизу.


Готовы строить ИИ без архитектурного долга и иллюзий?

Рассчитать стоимость безопасной ИИ-архитектуры: Калькулятор EasyByte

Технический аудит вашего проекта: Бесплатная консультация

Telegram X / Twitter

Есть задача? Давайте сделаем лучше, чем в кейсах

Через 24 часа получите план и смету.