TY - THES A3 - Kleine Büning, Hans A3 - Meyer auf der Heide, Friedhelm AB - In dieser Arbeit beschäftigen wir uns damit, wie Geräte (oder Agenten) in großen verteilen Systemen autonom lernen können, ihre Aktionen so zu koordinieren, dass eine gemeinsame Aufgabe möglichst gut gelöst wird. Insbesondere konzentrieren wir uns auf Probleme, die aus einer Abfolge verschiedener Situationen bestehen. Wir nehmen an, dass eine Problemlösung (Strategie) während des Betriebs gelernt wird und nur für die aktuelle Situation relevant ist. In der folgenden Situation können gelernte Strategien ggf. angepasst und weiter verwendet werden, oder sie müssen wegen zu großen Unterschieden verworfen werden. Wir stellen ein Modell auf, mit dessen Hilfe solche Probleme formal modelliert werden können und entwickeln darauf aufbauend einen verteilten Lernansatz. Dieses sogenannte Distributed Stateless Learning (DSL) Verfahren lernt mittels Reinforcement Learning, d.h. es lernt welche individuelle Aktion im Zusammenspiel mit dem Verhalten der anderen Agenten aktuell sinnvoll ist, indem Aktionen ausgeführt und numerische Rückmeldungen über die Aktionsgüte in den Lernprozess einbezogen werden. Um das Lernen in sehr großen Systemen zu beschleunigen, untersuchen wir zusätzlich verschiedene Koordinationsstrategien, die beispielsweise Wissen in der Umgebung ablegen oder bei denen Agenten lokal Informationen austauschen. Der entwickelte Ansatz wird theoretisch und empirisch untersucht, und wir zeigen, dass DSL in der Lage ist, optimale oder beinahe optimale Lösungen zu lernen. Neben diesen Ergebnissen stellen wir weitere Verfahren und Konzepte vor und geben Einblicke in relevante Fragestellungen, wie bspw. das Lernen mit verrauschten Wahrnehmungen. Am Ende bleibt festzuhalten, dass diese Arbeit erste Einsichten in das betrachtete Problemszenario bietet und dass effizientes Lernen in diesem Umfeld mittels DSL möglich ist. AU - Kemmerich, Thomas DA - 2012 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 06.07.2012 N1 - Paderborn, Univ., Diss., 2012 PB - Veröffentlichungen der Universität PY - 2012 T2 - Institut für Informatik TI - Learning and coordination in sequential multiagent problems UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-9112 Y2 - 2024-07-27T12:08:35 ER -