Titelaufnahme
Titelaufnahme
- TitelAdvanced Machine Learning Methods for Information Leakage Detection in Cryptographic Systems / Pritha Gupta ; 1. Reviewer Prof. Dr. Eyke Hüllermeier (Künstliche Intelligenz und Maschinelles Lernen Ludwig-Maximilians-Universität, München), 2. Reviewer Prof. Dr. Juraj Somorovsky (Department of Computer Science Paderborn University) ; Supervisor Prof. Dr. Eyke Hüllermeier
- Autor
- Gutachter
- Erschienen
- Umfang1 Online-Ressource (3, xi, 272 Seiten) Diagramme
- HochschulschriftUniversität Paderborn, Dissertation, 2025
- AnmerkungTag der Verteidigung: 09.05.2025
- Verteidigung2025-05-09
- SpracheEnglisch
- DokumenttypDissertation
- Schlagwörter (GND)
- URN
- DOI
Links
- Social MediaShare
- Nachweis
- IIIF
Dateien
Klassifikation
Zusammenfassung
In der heutigen datengesteuerten IT-Landschaft verschärft die Verbreitung öffentlicher Informationen die Herausforderung von Datenlecks und birgt die Gefahr, dass sensible Daten unbeabsichtigt durch beobachtbare Systemausgaben offengelegt werden. Herkömmliche statistische Methoden zur Detektion von Informationslecks, die auf der Schätzung von gegenseitiger Information beruhen, sind oft mit erheblichem Rechenaufwand und dem “Fluch der Dimensionalität” konfrontiert. Auf der anderen Seite mangelt es den neuen Ansätzendes überwachten maschinellen Lernens an einer theoretischen Grundlage und sie sind auf domänenspezifische Anwendungen mit ausgeglichenen binären Datenbeschränkt.In dieser Arbeit habe ich einen theoretischen Rahmen entwickelt, der statistisches Lernen und Informationstheorie integriert, um Informationslecks inkryptographischen Systemen zu quantifizieren und effektiv zu erkennen. Die vorgeschlagene verallgemeinerte Metrik LAS quantifiziert Informationslecks,indem es die Leistung des Bayes-Klassifikators nutzt, um die gegenseitigeInformation durch Kreuz-Entropie-Verlust (Log-Loss) und den Rang des Schlüsselbytes der AES-verschlüsselten Systeme zu schätzen. Mithilfe der Konsistenz von AutoML werden Benchmark-Tools zur Approximation der Leistung des Bayes-Klassifikators eingesetzt. Dies liefert robuste LAS-Schätzungen, die auch Systeme mit umfangreichen Schlüsselräumen effektiv adressieren. Die vorgeschlagenen Ansätze verwenden statistische Tests auf Schätzungen der gegenseitigen Information, Konfusionsmatrizen und Treffergenauigkeiten (Ac-curacy), die von AutoML-Tools erhalten wurden, um Informationslecks zuerkennen. Diese Tests werden mehrfach durchgeführt, und ihre Ergebnisse werden mithilfe der Holm-Bonferroni-Korrektur aggregiert, um zuverlässigeund sichere Entscheidungen über das Vorhandensein von Informationslecks zugewährleisten.Experimentelle Ergebnisse auf synthetischen und realen Datensätzen, erstellt mit für Bleichenbacher’s Seitenkanalangriff verwundbaren OpenSSL TLS-Servern, zeigen, dass die vorgeschlagenen Ansätze die bisherigen Methoden übertreffen. Bei AES-verschlüsselten Systemen werden Informationslecks durch Hardware-Seitenkanäle mithilfe von Metriken quantifiziert, welche auch die Anfälligkeit für Template-Angriffe auswerten. Die vorgeschlagenen automatisierten Blackbox-Ansätze verwenden Benchmark-AutoML-Tools zur Optimierung verschiedener CNN-Architekturen und zeigen, dass die zufällige Suchstrategieam effektivsten zur Identifizierung von Systemschwächen ist. Die Leistungsschwankungen dieser Tools machen jedoch weitere Verbesserungen für eine umfassende Sicherheitsanalyse kryptographischer Systeme erforderlich.
Abstract
In today’s data-driven world, the proliferation of public information exacerbates the challenge of information leakage (IL), risking the exposure of sensitive data through observable system outputs. Traditional statistical methods, related to mutual information (MI) estimation, often face significant computational complexities and the curse of dimensionality. Meanwhile, emerging supervised learning approaches lack a theoretical foundation and are limited to domain-specific applications with balanced binary data. In this work, I developed a theoretical framework integrating statistical learning and information theory to effectively quantify and detect IL in cryptographic systems. The proposed generalized measure leakage assessment score (LAS) quantifies IL by leveraging the Bayes predictor’s performance to estimate MI through Log-Loss and the rank of the key byte of the AES-encrypted systems. Leveraging the consistency of automated machine learning (AutoML), benchmark tools are employed to approximate Bayes predictor’s performance, providing robust LAS estimates, even for systems with extensive key spaces. Proposed approaches employ statistical tests on MI estimates, confusion matrices (CMs), and accuracies obtained from AutoML tools to detect IL. These tests are performed multiple times, and their results are aggregated using the Holm-Bonferroni correction to ensure reliable and confident decisions regarding the presence of IL. Experimental results on synthetic and real-world OpenSSL TLS servers, vulnerable to Bleichenbacher’s side-channel attack (SCA), show that the proposed approaches outperform baseline methods. For AES-encrypted systems, IL is quantified using metrics, also providing insights into the susceptibility to template SCAs. The proposed automated black-box approaches use benchmark AutoML tools to optimize convolutional neural networks (CNNs) architectures, identifying Random search as the most effective for identifying system vulnerabilities. However, the performance variability of these tools necessitates further improvements for comprehensive security analysis of cryptographic systems.
Inhalt
Statistik
- Das PDF-Dokument wurde 187 mal heruntergeladen.
Lizenz-/Rechtehinweis

