[1]

Quentin Larsen and TaoLi Tian, “Risk-Aware Reinforcement Learning for Safe Strategic Reasoning in Large Language Model Agents”, aimls, vol. 1, no. 1, May 2026.