Контекст. Любая агентная ИИ-система, выпущенная в продакшен, несёт два скрытых риска: накопленный технический долг (TD) и неотслеживаемые затраты энергии в рантайме. Хотя функциональное бенчмаркирование распространено, эмпирическая связь между внутренним структурным качеством (в частности, техническим долгом) и динамическим энергопотреблением во время исполнения остаётся неизученной - это создаёт «слепое пятно» для практиков и организаций, управляющих устойчивостью и операционными бюджетами в масштабе.
Цель. Авторы предлагают подтверждающее эмпирическое исследование, коррелирующее самопризнанный технический долг (SATD, Self-Admitted Technical Debt) с энергопотреблением в рантайме на уровне оборудования по разным агентным фреймворкам, чтобы определить, может ли качество кода направлять энергоосознанные проектные решения.
Метод. Будут оценены пять открытых агентных фреймворков путём выполнения стандартизированного набора задач в строго контролируемой среде. Технический долг будет измеряться автоматическим анализом исходного кода, а энергия в рантайме - на уровне оборудования. Исследование рассмотрит три вопроса: (RQ1) наличие TD в этих фреймворках; (RQ2) разброс энергопотребления в рантайме между архитектурами; (RQ3) статистическую корреляцию между TD фреймворка и его энергопотреблением на уровне задач.
Заключение. Результаты установят, может ли автоматический анализ исходного кода служить надёжным ранним индикатором для выбора энергоэффективного фреймворка, продвигая тем самым и «зелёную» инженерию ПО, и исследования качества агентного ИИ.
Плохой агентный код бьёт не только по поддержке, но и по инфраструктурному счёту.
Если фреймворк тащит технический долг, это может проявиться в лишних вызовах, тяжёлом рантайме и энергопотреблении. Veai помогает находить такие скрытые издержки раньше: через анализ кода, связей, запусков и результатов в JetBrains IDE, пока «дорогая архитектура» не стала постоянной строкой бюджета.
Перевод подготовлен технической командой Veai на основе arXiv:2606.10702. Первоисточник (англ.): arxiv.org/abs/2606.10702.