Robuste Reinforcement Learning Verfahren zur Identifikation nichtlinearer Systeme