Kooperative Trajektorienfolgeregelung basierend auf Reinforcement-Learning-Methoden