
Швейцарский стартап LogicStar нацелен на вступление в игру с искусственными интеллектуальными агентами. Зимой 2024 года основанный стартап получил 3 миллиона долларов в предварительном раунде финансирования, чтобы предоставить инструменты для разработчиков, способные проводить автономное обслуживание программных приложений, вместо более типичного использования искусственного интеллекта для совместного разработки кода.
Генеральный директор и соучредитель LogicStar Борис Паскалев предполагает, что их искусственные интеллектуальные агенты могут заключить партнерство с агентами по разработке кода - такими, как, скажем, похожие на Cognition Labs' Devin, в выгодном для бизнеса смысле.
Проблема достоверности кода возникает как для искусственных интеллектуальных агентов, строящих и развертывающих программное обеспечение, так и для человеческих разработчиков, и LogicStar хочет внести свой вклад в развитие, автоматически обнаруживая и исправляя ошибки, где бы они ни появились в развернутом коде.
На данный момент Паскалев предполагает, что "даже лучшие модели и агенты" не в состоянии решить большинство ошибок, с которыми они сталкиваются - отсюда идея о создании стартапа по искусственному интеллекту, цель которого заключается в улучшении этих шансов и реализации мечты об уменьшении утомительного обслуживания приложений.
В этом контексте они строят платформу на базе больших языковых моделей (LLM). Это позволяет LogicStar использовать различные LLM и максимизировать полезность своих искусственных интеллектуальных агентов, опираясь на то, какая основная модель лучше всего справляется с решением конкретной проблемы кода.
Паскалев утверждает, что у основателей есть технические и отраслевые знания для создания платформы, способной решать проблемы программирования, которые могут вызвать сложности или перехитрить LLM, работающие в одиночку. У них также есть предыдущий предпринимательский успех: он продал свой предыдущий стартап по проверке кода, DeepCode, кибербезопасностному гиганту Snyk в сентябре 2020 года.
"В начале мы думали о том, чтобы построить большую языковую модель для кода", - сказал он TechCrunch. "Затем мы поняли, что это быстро станет товаром... Сейчас мы строим, исходя из того, что все эти большие языковые модели уже существуют. Предполагая, что есть действительно приличные [ИИ] агенты для кода, как мы можем извлечь максимальную бизнес-ценность из них?"
Он сказал, что идея основана на понимании командой анализа программных приложений. "Совместно с крупными языковыми моделями - затем сосредотачиваемся на определении и проверке предложений этих крупных языковых моделей и ИИ-агентов".
Разработка, ориентированная на тестирование
Что это означает на практике? Паскалев говорит, что LogicStar проводит анализ каждого приложения, на котором установлена их технология, используя "классические методы информатики", чтобы построить "базу знаний". Это дает их ИИ-агенту всестороннюю карту входов и выходов программного обеспечения; как переменные связаны с функциями; и любые другие связи и зависимости и т. д.
Затем, для каждой найденной ошибки, ИИ-агент способен определить, какие части приложения затронуты, позволяя LogicStar сузить круг функций, которые нужно симулировать для тестирования десятков потенциальных исправлений.
По словам Паскалева, это "минимизированная среда выполнения" позволяет ИИ-агенту выполнять "тысячи" тестов с целью воспроизведения ошибок для выявления "неудачного теста" и, благодаря подходу "ориентированному на тестирование разработки", в конечном итоге прийти к решению, которое работает.
Он подтверждает, что сами исправления ошибок берутся из LLM. Но поскольку платформа LogicStar позволяет этой "очень быстрой среде выполнения", их ИИ-агенты могут работать в масштабе, чтобы выявить лучшее, что могут предложить LLM, и предложить пользователям путь к лучшему, что могут предложить LLM.
"Мы видим, что [LLMs] отлично подходят для прототипирования, тестирования вещей и т. д., но они совершенно не годятся для [кода] в производстве, коммерческих приложений. Я думаю, мы далеки от этого, и именно это предлагает наша платформа", - аргументирует он. "Чтобы извлечь все эти возможности моделей сегодня, мы можем безопасно извлечь коммерческую ценность и фактически сэкономить время разработчиков, чтобы действительно сосредоточиться на важном".
Целевой аудиторией LogicStar должны стать предприятия. Их "силиконовые агенты" предназначены для сотрудничества с корпоративными командами разработчиков, хотя за долю от заработной платы, требуемой для найма человеческого разработчика, они будут заниматься разнообразными задачами по обслуживанию приложений и освобождать инженерный талант для более творческой и / или сложной работы. (Ну, по крайней мере, пока LLM и ИИ-агенты не станут намного более способными.)
Хотя реклама стартапа о рекламном материале охватывает "полностью автономную" возможность обслуживания приложений, Паскалев подтверждает, что платформа позволит человеческим разработчикам просматривать (или по-другому контролировать) исправления, вызываемые их ИИ-агентами. Доверие может быть - и должно быть - заработано первым.
"Точность, которую обеспечивает человеческий разработчик, колеблется от 80 до 90%. Наша цель [для наших ИИ-агентов] - быть именно там", - добавляет он.
Для LogicStar все еще рано: альфа-версия их технологии находится в тестировании с рядом неуказанных компаний, которые Паскалев называет "дизайн-партнерами". В настоящее время технология поддерживает только Python, но расширения на TypeScript, JavaScript и Java обещаются "скоро".
"Основная цель [с предварительным раундом финансирования] - продемонстрировать, что технология работает с нашими дизайн-партнерами - с акцентом на Python", - добавляет Паскалев. "Мы уже потратили на это год, и у нас есть много возможностей для расширения. И вот почему мы пытаемся сначала сосредоточиться на этом, чтобы продемонстрировать ценность в одном случае".
Предварительное финансирование стартапа возглавило европейское венчурное фирма Northzone, к которому также присоединились ангельские инвесторы из DeepMind, Fleet, Sequoia scouts, Snyk и Spotify.
В заявлении Мишиэля Коттинга, партнера в Northzone, говорится: "Процесс генерации кода, управляемый искусственным интеллектом, все еще находится на начальной стадии развития, но уже видны революционные выигрыши в производительности. Потенциал этой технологии в оптимизации процессов разработки, снижении затрат и ускорении инноваций огромен, а обширные технические знания команды и подтвержденная история позиционируют их для достижения реальных, значительных результатов. Будущее разработки программного обеспечения переформатируется, и LogicStar сыграет ключевую роль в обслуживании программного обеспечения".
LogicStar ведет список ожидания потенциальных клиентов, желающих выразить заинтересованность в получении раннего доступа. Они сообщили нам, что планируется выпуск бета-версии позже в этом году.