Masterarbeit, 2021
103 Seiten, Note: 1.7
This thesis investigates the use of trace-based runtime prediction for recurring data-parallel processing jobs in cloud data centers. The goal is to improve resource utilization and scheduling by accurately predicting the execution time of upcoming jobs based on the characteristics of similar past jobs.
The main keywords and focus topics of this thesis are cloud computing, data-parallel processing, job scheduling, runtime prediction, trace analysis, deep learning, job dependency embedding, clustering, and resource utilization.
The goal is to accurately estimate the execution time of upcoming jobs to improve resource utilization and scheduling efficiency.
Neural networks are utilized to embed complex job dependencies, allowing the system to identify similarities between recurring processing tasks.
Clustering techniques group similar recurring jobs together based on their embedded dependencies to create more accurate prediction models.
The research used a recently published trace dataset containing more than 200,000 complex, real-world data-parallel processing jobs.
Execution time is affected by many dynamic factors, including cluster status, specific user requirements, and complex parallelization patterns.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

