Improving instruction hierarchy in frontier LLMs

AI März 11, 2026

OpenAI is enhancing its frontier LLMs with the IH-Challenge, training them to prioritize trusted instructions. This initiative aims to improve instruction hierarchy, enhance safety steerability, and bolster resistance to prompt injection attacks.