Tilbage til Nyheder
10.3.2026 AI Nyheder 1 minutter

Forbedret instruktionshierarki i avancerede LLM'er

IH-Challenge er en trænings- og evalueringsmetode for frontløber-LLM'er, der lærer modeller at prioritere betroede instruktioner frem for ondsindede eller modstridende prompts. Metoden forbedrer instruktionshierarkiet, øger modellernes sikkerheds-styrbarhed og gør dem mere modstandsdygtige over for prompt-injektion, hvilket reducerer risikoen for at udføre skadelige eller utilsigtede kommandoer.