TY - THES AB - Teil I dieser Arbeit untersucht die Stabilität und Konvergenz von verteilten stochastischen Approximationsalgorithmen (SA), die durch Age-of-Information (AoI) beeinflusst werden. Das Hauptergebnis ist eine Verallgemeinerung des SA-Stabilitätstheorems von Borkar und Meyn auf verteilte SA, das bisher nur für beschränkte AoI-Prozesse bekannt war. Über verteilte SA hinaus ermöglicht dieses Ergebnis ein neues Stabilitätstheorem für SA mit Momentum. Als Anwendung des neuen verteilten SA-Stabilitätstheorems wird in dieser Arbeit der asynchrone stochastische Gradientenabstieg untersucht und eine AoI-abhängige Konvergenzratenabschätzung vorgestellt. Schließlich wird eine spezielle verteilte SA-Situation für Multi-Agenten Markov-Games betrachtet. Zunächst wird ein neuartiger Deep Multi-Agenten-Actor-Critic Reinforcement-Learning-Algorithmus vorgeschlagen, der für das Online-Lernen auf der Basis von kommunizierten Daten geeignet ist. Weiter wird die Konvergenz des Algorithmus unter milden Kommunikationsannahmen gezeigt. Darüber hinaus werden Bedingungen an das AoI der Daten aus der Lernumgebung (des kontrollierten Markov-Prozesses) charakterisiert, um die Konvergenz des resultierenden Zustandsmarkov-Prozesses zu einer stationären Verteilung zu gewährleisten. Die grundlegende Eigenschaft für die Analyse verteilter SA in Teil I ist die Existenz von Zufallsvariablen mit bestimmten Momentschranken, die die jeweiligen AoI-Prozesse stochastisch dominieren. Teil II dieser Arbeit untersucht daher verschiedene AoI-Modelle, um die Existenz von AoI-dominierenden Zufallsvariablen und allgemein die Verteilung von AoI-Prozessen zu charakterisieren. Insbesondere wird gezeigt, wie stark mischende Ereignisprozesse sowie asynchrones Rechnen modelliert als parallele Punktprozesse zu AoI-Prozessen mit dominierenden Zufallsvariablen führen. AU - Redder, Adrian CY - Paderborn DA - 2024 DO - 10.17619/UNIPB/1-1997 DP - Universität Paderborn LA - eng N1 - Tag der Verteidigung: 05.04.2024 N1 - Universität Paderborn, Dissertation, 2024 PB - Veröffentlichungen der Universität PY - 2024 SP - 1 Online-Ressource (187 Seiten) T2 - Institut für Informatik TI - Distributed asynchronous stochastic approximation algorithms with unbounded stochastic information delays - theory and applications TT - Verteilte asynchrone stochastische Approximationsalgorithmen mit unbeschränkten stochastischen Informationsdelays - Theorie und Anwendungen UR - https://nbn-resolving.org/urn:nbn:de:hbz:466:2-52009 Y2 - 2026-01-14T01:27:03 ER -