Go to page
 

Bibliographic Metadata

Title
Risk aware overbooking for SLA based scheduling systems
AuthorBirkenheuer, Georg
ExaminerBrinkmann, André ; Meyer auf der Heide, Friedhelm
Published2012
Institutional NotePaderborn, Univ., Diss., 2012
Annotation
Tag der Verteidigung: 14.09.2012
LanguageEnglish
Document TypesDissertation (PhD)
URNurn:nbn:de:hbz:466:2-9882 
Files
Risk aware overbooking for SLA based scheduling systems [3.06 mb]
Links
Reference
Classification
Abstract (German)

Wissenschaft und Wirtschaft profitieren von modernen computergestützten Designprozessen und Simulationen. Wenn dabei die maximale Rechenlast nicht kontinuierlich sondern nur in seltenen Fällen benötigt wird, ist es effizienter Rechenleistung zu teilen oder zu mieten, als eine eigene Rechnerinfrastruktur zu unterhalten. Die dadurch entstehende Nachfrage wird von Ressourcenanbietern gedeckt. Sie verkaufen Rechenleistung auf Basis von automatisch verhandelbaren Dienstgütevereinbarungen. Diese enthalten die benötigten Ressourcen, Entgelte und Strafzahlungen, die Laufzeit und den Endtermin. Statistiken zeigen, dass die Kunden die Laufzeit nicht präzise schätzen können und sie deshalb häufig überschätzen. Die Folge sind brachliegende Ressourcen. Eine hohe Auslastung ist aber wichtig, um konkurrenzfähig und profitabel zu arbeiten. Diese Dissertation stellt zwei Überbuchungsmechanismen vor, die es erlauben Laufzeitüberschätzungen auszunutzen. Die beiden Ansätze verwenden Statistiken über die Nutzerlaufzeitschätzungsgenauigkeit, um die Fehlschlagwahrscheinlichkeit bei einer Überbuchung zu ermitteln. Die Überbuchung erfolgsversprechender Aufträge steigert die Auslastung der Ressourcen, den Gewinn des Anbieters und vermeidet Strafzahlungen wegen Jobausfällen. Das Leistungsvermögen der Überbuchungsansätze wird auf Basis von realen Jobabläufen evaluiert. Die Simulationen zeigten, dass Ressourcenanbieter von Überbuchungsmechanismen profitierten. Auch wenn einige der zusätzlichen Jobs fehlschlagen, erlaubt ein vorsichtiges Überbuchen mehr Jobs erfolgreich zu Ende zu führen. Es ist möglich die Auslastung und den Gewinn eines Anbieters durch Überbuchen zu verdoppeln.

Abstract (English)

Academia as well as the economy profit from the abilities of todays computer-aided design processes and simulations. When the need for compute resources is not continuous but occurs in peak loads, it is more efficient for a large number of research groups to share an infrastructure or to rent the compute power on demand instead of maintaining an own infrastructure. Compute resource providers cover the resulting demand. They trade compute power on the basis of automatically negotiable contracts including estimated resources, fees and penalties, runtime, and deadlines. Statistics show that users lack the ability to accurately estimate a jobs runtime and tend to overestimate. This leads to low utilization of the providers infrastructure. However, a high utilization is important to be competitive and profitable. This thesis introduces two overbooking approaches for the scheduling and negotiation mechanisms of a compute provider. Overbooking exploits the runtime overestimations by using statistics on the user estimation quality to calculate the probability of failure and success when a job is planned with less runtime. Accepting additional, promising jobs increases the utilization of the underlying compute infrastructure, increases the providers profit, and minimizes the risk of job failures due to overload. The potential of the presented overbooking approaches is shown based on simulations with real-world job traces. The evaluation demonstrates that academic and commercial resource providers can benefit from overbooking. Careful overbooking allows to successfully execute more jobs even if a few of the additional accepted jobs fail. It is possible to double a providers utilization and profit by overbooking.