Entwicklung eines Lernverfahrens zur Trajektorienoptimierung für Multi-Roboter-Systeme