Go to page

Bibliographic Metadata

Learning and imitation in heterogeneous robot groups / Wilhelm Richert
AuthorRichert, Wilhelm
DescriptionX, 162 S. : Ill., graph. Darst.
Institutional NotePaderborn, Univ., Diss., 2009
Document TypesDissertation (PhD)
Learning and imitation in heterogeneous robot groups [4.14 mb]abstract [0.16 mb]abstract [0.15 mb]


As robots become increasingly affordable, they are used in ever more diverse areas in order to perform increasingly complex tasks. These tasks are typically preprogrammed by a human expert. In some cases, however, this is not feasible -- either because of the inherent complexity of the task itself or due to the dynamics of the environment. The only possibility then is to let the robot learn the task by itself. This learning process usually involves a long training period in which the robot experiments with its surroundings in order to learn the desired behavior. If robots have to learn a shared goal in a group, the robots should imitate each other in order to reduce their individual learning time. The question how this can be done in a robot group has been considered in this thesis, i. e., how robots in a group can learn to achieve their shared goal and imitate each other in order to increase the performance and the speed of learning by spreading the learned knowledge in the group.

To allow for this intertwined learning and imitation, a dedicated robot architecture has been developed. On the one hand, it fosters autonomous and self-exploratory learning. On the other hand, it allows for manipulating the learned knowledge and behavior to account for new knowledge gathered by the imitation process. Learning of behavior is achieved by separately learning at two levels of abstraction. At the higher level, the strategy is learned as a mapping from abstract states to symbolic actions. At the lower level, the symbolic actions are grounded autonomously by learned low-level actions.

The approaches of imitation presented in this thesis are unique in that they relieve the requirements that governed multi-robot imitation so far. It enables robots in a robot group to imitate each other in a non-obtrusive manner. The robots can thus increase their learning speed and thereby the overall performance of the group by simply observing the other group members without requiring them to stick to a certain communication protocol that would provide the necessary information. With the presented approach, a robot is able to infer the behavior that the observed demonstrator is performing and to replay the beneficial behavior with its own capabilities.

In addition, the presented approaches allow the robots to apply imitation even if the group is heterogeneous. Normally, the performance of a group degrades if robots with incompatible capabilities imitate each other. Capability differences arise if robot morphologies differ in a robot group. This is the case if different robots from different manufacturers form a robot group that has to achieve shared goals. This thesis presents an approach that is able to determine similarities or differences between robots. This can guide the robots in a heterogeneous robot group in order to determine those robots for imitation that are most similar to themselves.


Da Roboter immer erschwinglicher werden, werden sie in immer mehr Bereichen für immer komplexere Aufgaben eingesetzt. Gewöhnlich werden Roboter speziell für diese Aufgaben von Hand programmiert. Aufgrund der Anforderungen der Einsatzumgebung des Roboters oder auch der Aufgabenkomplexität ist dies aber nicht immer möglich. In diesem Fall muss dann das gewünschte Verhalten vom Roboter selbst gelernt werden. Dieser Lernprozess beinhaltet gewöhnlich eine lange Trainingsphase, in der der Roboter mit seiner Umgebung experimentiert, um das gewünschte Verhalten zu lernen. Diese Trainingszeit könnte jedoch verkürzt werden, wenn mehrere Roboter in einer Gruppe das gleiche Ziel haben und einander imitieren könnten. Wie dies in einer Robotergruppe möglich ist, wird in dieser Dissertation untersucht. Sie beschäftigt sich mit der Frage, wie Roboter in einer Gruppe lernen können, das gewünschte Verhalten zu erreichen und zusätzlich einander imitieren können, um die Lernzeit zu verkürzen.

Um dies zu ermöglichen, wurde eine Roboterarchitektur entwickelt, in der Lernen und Imitation verzahnt werden kann. Auf der einen Seite fördert die Architektur selbst-erforschendes Lernen. Auf der anderen Seite ermöglicht die Architektur, das durch Imitation erlangte Verhaltenswissen in das eigene Verhalten zu integrieren. Das Lernen von Verhalten wird separat auf zwei Abstraktionsebenen erreicht. Zum einen werden abstrakte Strategien in Form von abstrakten Zuständen und symbolischen Aktionen gelernt. Diese symbolischen Aktionen werden wiederum von einer Komponente zur Verfügung gestellt, die autonom neue Basisverhalten herausfinden und lernen kann.

Die in dieser Arbeit vorgestellten Imitationsansätze erlauben es Robotern, einander zu imitieren, ohne Einblick in die jeweiligen internen Datenstrukturen der anderen Robotern zu erhalten. Ein imitierender Roboter erhält damit die Möglichkeit, das beobachtete Verhalten aus seinen Beobachtungen abzuleiten und mit seinen eigenen Fähigkeiten zu reproduzieren.

Zusätzlich erlauben die vorgestellten Ansätze den Einsatz von Imitation in heterogenen Robotergruppen. Normalerweise verschlechtert sich der Nutzen von Imitation, wenn Roboter mit unterschiedlichen Fähigkeiten versuchen einander zu imitieren. In dieser Arbeit wird ein Ansatz vorgestellt, mit dem Ähnlichkeiten bzw. Unterschiede in den Verhaltensfähigkeiten der Roboter berechnet werden können. Dies kann dann benutzt werden, um jeweils den ähnlichsten Roboter für die Imitation auszuwählen.