ИИ в бизнесе не стартует с кода: сначала данные и смысл
Не спешите писать первое корпоративное ИИ-приложение. Найдите конкретную задачу и наведите порядок в данных, тогда результат удивит.
Основные идеи
Мнение автора
Команды сходят с ума из-за рейтингов, хотя любая модель от OpenAI, Anthropic или Llama закрывает 90% задач. В реальности всё решают данные, доступ и контроль, а не плюс один процент в тесте. Мой совет простой: начните с памяти, RAG и человеческой проверки — так ИИ перестаёт сочинять и начинает приносить пользу.
В мире искусственного интеллекта отличать полезную информацию от шума становится все труднее. Ежедневно выходит новый эталон, «передовая» модель или звучат заявления о неактуальности вчерашней архитектуры. Разработчики получают задачу создать первое приложение на базе ИИ, часто внутри крупной компании, и здесь огромное количество анонсов вызывает ступор при выборе.
Рейтинги здесь бесполезны, так как они меняются слишком часто. Только за последнюю неделю мы получили новую модель от Mistral, масштабное обновление от Google и претендента на лидерство в тестах по программированию, который обходит GPT-4o. Как поступить? Ждать? Но если внедрять текущую модель, то код устареет еще до запуска в продакшен. Или проблема глубже? Если вы еще не строите полностью автономные системы, которые планируют, рассуждают и выполняют сложные задачи, то уже сильно отстали?
Забудьте эту ерунду. Это ошибочное мнение.
Реальность корпоративного ИИ почти не имеет ничего общего с победителями «битвы чат-ботов» текущей недели. Она полностью зависит от скучной работы по проектированию, управлению и интеграции данных. Мы выходим из фазы веры в магию ИИ и вступаем в фазу индустриализации. Задача состоит не в выборе самой умной модели, а в создании системы, которая выдержит абсурдность реального мира.
Ниже приведены несколько советов по разработке вашего первого приложения.
Это ловушка!
Попасть в «иллюзию таблицы лидеров» очень легко. Вы видите превосходство модели на 1% в математическом тесте и считаете ее единственным вариантом. Называют такой подход «оценкой по ощущениям». Это неплохо показывает, насколько «умным» кажется чат-бот в непринужденной беседе, но ужасно подходит для рабочей нагрузки. Пора прекратить смотреть на ИИ сквозь призму программных войн 1990-х годов, когда одна платформа забирала все.
Сами модели превращаются в громоздкую недифференцированную инфраструктуру. Она нужна всем, но управлять ею никто не хочет. Неважно, используете вы Anthropic, OpenAI или модель с открытыми весами вроде Llama, полученного уровня интеллекта хватит для 90% корпоративных задач. Для первой версии различия минимальны. «Лучшая» модель — та, к которой можно получить безопасный и надежный доступ.
Реальная польза лежит в прикладной плоскости, а не в самой модели. Если инструмент решает реальную бизнес-задачу, например автоматическую сверку счетов или составление кратких обзоров юридических документов, то место базовой модели в рейтинге никого не волнует.
Физика ИИ принципиально отличается от традиционного программного обеспечения. В сфере открытого исходного кода главным активом считался код. В мире ИИ модель — это временный товар. Активом становятся ваши данные и способы их передачи этой модели.
Думайте как база данных
Конечно, после выбора модели возникает соблазн сразу создать «агента». Все хотят получить похвалу за разработку ИИ, который просматривает веб-страницы, запрашивает данные из баз и принимает решения. Советую проявить осторожность. Скорее всего, к работе с агентами вы еще не готовы. Причина не в низком интеллекте ИИ и даже не в отсутствии у вас большого опыта в этой сфере.
Изучите связанные вопросы:
- Какие конкретные требования к данным имеют решающее значение для агентного ИИ?
- Как избежать дорогостоящих ошибок в работе с ИИ для моего бизнеса?
- Как следует расставлять приоритеты в проектах по внедрению ИИ-агентов с точки зрения их коммерческой ценности?
- Как ИТ-директорам безопасно перейти к использованию агентного ИИ?
- Какая конкретная инфраструктура необходима для агентного ИИ?
Нет, главная проблема кроется в недостаточной чистоте ваших данных.
Память ИИ, по сути, представляет собой проблему баз данных. Без памяти агент превращается в очень дорогой генератор случайных чисел. Агенты работают со скоростью машины, но используют данные от людей. Если эта информация не структурирована, не упорядочена или не управляется, агент будет уверенно совершать ошибки в больших масштабах.
Многие предприятия до сих пор пытаются понять местонахождение своих данных, поэтому о предоставлении доступа к ним для большой языковой модели говорить рано. Мы склонны рассматривать память в ИИ как волшебное контекстное окно. Это ошибка. Это база данных. К ней требуется тот же строгий подход, что и к журналам транзакций. Нужны схемы, контроль доступа и брандмауэры, которые предотвратят искажение фактов и утечку конфиденциальной информации.
При разработке первой системы ИИ начните с уровня памяти. Решите, что ИИ может знать, где хранятся знания и как они обновляются. Только потом думайте о подсказках. И, кстати, о чём стоит подумать в первую очередь? О выводе данных.
Начните с вывода
Раньше всех беспокоила огромная стоимость обучения моделей. Но для предприятий это сейчас неактуально. ИИ сегодня — это преимущественно вывод информации или применение знаний для создания приложений. Он станет по-настоящему полезным для бизнеса по мере применения моделей к управляемым корпоративным данным. Лучшее место для развития вашего ИИ — не амбициозная агентная система, а простой конвейер генерации с дополненной информацией (RAG).
Что это значит на практике? Найдите массив скучных и неряшливых документов, таких как кадровые политики, техническая документация или журналы обслуживания клиентов, и создайте систему, которая отвечает на вопросы пользователя только на основе этих данных. Это заставит вас решать сложные задачи, которые действительно дадут компании конкурентное преимущество. Вот несколько примеров:
- Загрузка данных: как разбить и проиндексировать PDF-файлы для понимания моделью?
- Управление: как гарантировать, что модель не ответит на вопросы, которые пользователь не имеет права задавать?
- Задержка: как обеспечить достаточную скорость, чтобы люди реально пользовались инструментом?
Такая работа может показаться скучной. Но LLM по сути являются ядром новой операционной системы. С ядром напрямую вы не взаимодействуете. Вы создаете пользовательские приложения на его основе. Ваша задача — построить это пользовательское пространство, куда входят интерфейс, логика и обработка данных.
Создайте золотой путь
При работе в сфере разработки платформ инстинкт может подсказать всё заблокировать. Возникает желание выбрать одну модель, один API и заставить всех разработчиков использовать только его. Это ошибка. Команды платформ не должны становиться «отделом отказов». При создании барьеров разработчики просто обойдут их с помощью личных кредитных карт и неконтролируемых API.
Вместо этого создайте «золотой путь». Разработайте набор компонуемых сервисов и механизмов защиты. Сделайте правильный способ создания приложений самым простым. Стандартизируйте интерфейс, например формат API, совместимый с OpenAI и поддерживаемый многими поставщиками, включая vLLM. Это позволит позже сменить модель бэкэнда при изменении ситуации. Сейчас выберите быстрый, совместимый и доступный вариант. А затем двигайтесь дальше.
Цель состоит в том, чтобы направлять темпы работы разработчиков, а не подавлять их. Предоставьте им безопасную песочницу с уже заложенным управлением данными, чтобы они могли экспериментировать без риска нанести серьезный вред.
Первое приложение проектируйте с участием человека в процессе. Не пытайтесь автоматизировать всё сразу. Используйте ИИ для генерации черновика отчета или варианта SQL-запроса, а проверку и выполнение оставьте человеку. Это снижает риск иллюзий и гарантирует, что вы дополняете человеческий интеллект, а не заменяете его роботизированной болтовней.
Тем не менее, если вы не следите за публичными рейтингами, как узнать качество модели? Вы не гадаете. Вы тестируете.
OpenAI и Anthropic делают акцент на «разработке на основе оценки», но сложный фреймворк для начала не требуется. Вам хватит 50–100 реальных примеров того, что должна делать модель — конкретные вопросы с правильными ответами — и скрипт для их запуска. При выходе новой модели с обещанием нового уровня просто запустите на ней свои 50 примеров. Если она решает ваши задачи быстрее или дешевле текущей, переключайтесь. Если нет — игнорируйте. Важен только ваш собственный рейтинг.
Будьте скучными
Короче говоря, сосредоточьтесь на своих данных. Сосредоточьтесь на управлении данными. Сосредоточьтесь на решении скучной проблемы для конкретного пользователя в вашей компании, который тонет в документации или выполняет повторяющиеся задачи. Игнорируйте рейтинги. Это показатели тщеславия для исследователей.
В эпоху ИИ победит тот, кто сделает интеллектуальные решения на основе управляемых данных дешевыми, простыми и безопасными. Возможно, это не вызовет вирусную волну обсуждений в соцсетях, но это обеспечит вам приложение, которое действительно выживет в корпоративной среде.
















