TY  - THES
A3  - Kleine Büning, Hans
A3  - Meyer auf der Heide, Friedhelm
AB  - In dieser Arbeit beschäftigen wir uns damit, wie Geräte (oder Agenten) in großen verteilen Systemen autonom lernen können, ihre Aktionen so zu koordinieren, dass eine gemeinsame Aufgabe möglichst gut gelöst wird. Insbesondere konzentrieren wir uns auf Probleme, die aus einer Abfolge verschiedener Situationen bestehen. Wir nehmen an, dass eine Problemlösung (Strategie) während des Betriebs gelernt wird und nur für die aktuelle Situation relevant ist. In der folgenden Situation können gelernte Strategien ggf. angepasst und weiter verwendet werden, oder sie müssen wegen zu großen Unterschieden verworfen werden. Wir stellen ein Modell auf, mit dessen Hilfe solche Probleme formal modelliert werden können und entwickeln darauf aufbauend einen verteilten Lernansatz. Dieses sogenannte Distributed Stateless Learning (DSL) Verfahren lernt mittels Reinforcement Learning, d.h. es lernt welche individuelle Aktion im Zusammenspiel mit dem Verhalten der anderen Agenten aktuell sinnvoll ist, indem Aktionen ausgeführt und numerische Rückmeldungen über die Aktionsgüte in den Lernprozess einbezogen werden. Um das Lernen in sehr großen Systemen zu beschleunigen, untersuchen wir zusätzlich verschiedene Koordinationsstrategien, die beispielsweise Wissen in der Umgebung ablegen oder bei denen Agenten lokal Informationen austauschen. Der entwickelte Ansatz wird theoretisch und empirisch untersucht, und wir zeigen, dass DSL in der Lage ist, optimale oder beinahe optimale Lösungen zu lernen. Neben diesen Ergebnissen stellen wir weitere Verfahren und Konzepte vor und geben Einblicke in relevante Fragestellungen, wie bspw. das Lernen mit verrauschten Wahrnehmungen. Am Ende bleibt festzuhalten, dass diese Arbeit erste Einsichten in das betrachtete Problemszenario bietet und dass effizientes Lernen in diesem Umfeld mittels DSL möglich ist.
AU  - Kemmerich, Thomas
DA  - 2012
DP  - Universität Paderborn
LA  - eng
N1  - Tag der Verteidigung: 06.07.2012
N1  - Paderborn, Univ., Diss., 2012
PB  - Veröffentlichungen der Universität
PY  - 2012
T2  - Institut für Informatik
TI  - Learning and coordination in sequential multiagent problems
UR  - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-9112
Y2  - 2024-07-27T12:08:35
ER  -