Исследователи из Университета Южной Калифорнии представили PDDL-INSTRUCT — фреймворк, который учит большие языковые модели планировать в строгих логических системах. Он решает одну из главных проблем современных LLM — низкую эффективность в последовательных рассуждениях, когда от модели требуется не просто ответ, а формально выстроенный план действий.
Обычно языковые модели теряют точность там, где важно описывать каждое действие и его последствия в правильном порядке. PDDL-INSTRUCT интегрирует цепочки рассуждений (Chain-of-Thought) и автоматическую верификацию шагов, обучая ИИ не только строить планы, но и проверять их на логическую корректность.
Фреймворк опирается на три ключевых принципа. Во-первых, модель учится явно рассуждать о том, какие действия возможны, к каким состояниям они ведут и не нарушают ли внутренние правила системы. Во-вторых, процесс планирования разбивается на элементарные шаги — от проверки предусловий до контроля эффектов и инвариантов. И наконец, на этапе обратной связи подключается внешний верификатор VAL, который не только указывает на ошибку, а подробно объясняет ее природу. Это позволяет модели осознанно исправлять собственные логические сбои.
Результаты убедительные: точность планирования достигла 94% на стандартных тестах — это на 66% выше, чем у базовых LLM. Потому что, в отличие от типичных моделей, PDDL-INSTRUCT не просто запоминает удачные решения, а восстанавливает саму логику их построения, приближаясь к принципам классических планировщиков.
Работа показывает, что сочетание формальной логики, пошаговой декомпозиции и верификации способно сделать языковые модели значительно надежнее в планировании. Разработки в этом направлении открывают путь к использованию ИИ там, где ошибка в процессе недопустима — в робототехнике, логистике, промышленной автоматизации и медицине, где каждый шаг должен быть не только выполнен, но и обоснован.