Bachelorarbeit, 2022
64 Seiten, Note: 2,0
1 Einleitung
1.1 Spedition und Logistik im Wandel der Zeit
1.2 Der Nahverkehr
1.3 Logistik 4.0
1.4 Problemstellung
1.5 Forschungsfrage und Zielgruppe
1.6 Methodik
1.7 Motivation
2 Grundlagen des Machine Learning
2.1 Vorhersagemodelle
2.2 Datenbasis
2.3 Faktoren für die Berechnung
3 Datenbasis
3.1 Quelle
3.2 Quelldaten: Untersuchung und Bereinigung
3.3 Merkmale
3.4 Modellierung der unabhängigen Variablen
3.5 Identifizierung von unvorhersehbaren Ereignissen
3.6 Datenaufbereitungszyklus
4 Algorithmen
4.1 Lineare Modelle (Regressionsanalyse)
4.1.1 Lineare Regression: Trendanalyse / Zeitreihenanalyse
4.1.2 Multiple lineare Regression
4.1.3 Ridge-Regression
4.2 K–nächste Nachbarn
4.3 Entscheidungsbäume
4.3.1 Random Forests
4.3.2 Gradient Boosting
4.4 Neuronale Netze
5 Vergleich / Auswertung
6 Anwendung in der Praxis
7 Fazit
8 Ausblick
Das Hauptziel dieser Arbeit ist die Identifikation des optimalen Algorithmus aus dem Bereich der Künstlichen Intelligenz, um die Tonnage im speditionellen Nahverkehr präzise vorherzusagen. Die zentrale Forschungsfrage untersucht, welcher Algorithmus unter den gegebenen Bedingungen die zuverlässigsten Ergebnisse liefert.
3.2 Quelldaten: Untersuchung und Bereinigung
Für die weitere Verarbeitung müssen die Quelldaten untersucht und bereinigt werden. Dies ist ein Prozess innerhalb der Datenanalyse. Er bildet die Schnittstelle zwischen der Datensammlung und der weiteren Verarbeitung. Es muss bereits an dieser Stelle auf den Quelldaten geschehen, um frühzeitig Ausreißer und unrealistische Daten finden und korrigieren zu können.
Dieses Vorgehen geschieht mit der Programmiersprache R und der Software RStudio. Zunächst wird die ursprüngliche Liste eingelesen und von den nicht benötigten Attributen gesäubert. Hierzu bietet R verschiedene Möglichkeiten. Das Einlesen der Daten ist relativ einfach mit einer vorhandenen Methode aus einer Standardbibliothek. Es muss lediglich auf die Angabe des Headers sowie des Trennzeichens der Quelldatei geachtet werden.
Die Daten werden in einer Variable vom Typ data.frame gespeichert. Zunächst werden für die weitere Verarbeitung nichtmehr benötigte Attribute entfernt, es wird mit den folgenden Attributen weitergearbeitet: Auftragsdatum, Gewicht, LDM (Lademeter), Packstücke, Versender.Nummer (Kundennummer), Versender.PLZ (Postleitzahl), Versender.Str. (Straße).
1 Einleitung: Beschreibt die konservativ geprägte Logistikbranche, die Notwendigkeit der Digitalisierung und die spezifische Problemstellung der Tonnageschätzung im Nahverkehr.
2 Grundlagen des Machine Learning: Einführung in die Funktionsweise vorhersagender Algorithmen und die Bedeutung einer validen Datenbasis für den Lernerfolg.
3 Datenbasis: Erläutert die Herkunft, Bereinigung und notwendige Aufbereitung der realen Unternehmensdaten sowie die Identifikation relevanter Einflussfaktoren.
4 Algorithmen: Detaillierte Betrachtung und mathematische Herleitung verschiedener Regressionsmodelle, von einfachen linearen Modellen bis hin zu neuronalen Netzen.
5 Vergleich / Auswertung: Analyse der Ergebnisse der verschiedenen Algorithmen hinsichtlich ihrer Vorhersagequalität und Eignung für den praktischen Einsatz.
6 Anwendung in der Praxis: Diskussion über die Umsetzbarkeit und notwendige Schritte zur Integration der Modelle in das operative speditionelle Geschäft.
7 Fazit: Zusammenfassende Bewertung der Ergebnisse und Empfehlung des am besten geeigneten Algorithmus.
8 Ausblick: Diskussion über zukünftige Entwicklungen im Logistiksektor und das Potenzial weiterführender Datenanalysen.
Künstliche Intelligenz, Logistik, Nahverkehr, Spedition, Logistik 4.0, Industrie 4.0, Predictive Analytics, Machine Learning, Tonnagevorhersage, Regression, Entscheidungsbäume, Gradient Boosting, Neuronale Netze, Datenbasis, Digitalisierung
Die Arbeit untersucht den Einsatz von Künstlicher Intelligenz, um die Tonnage für Abholtouren im speditionellen Nahverkehr vorherzusagen und so die Frachtraumpalnung zu optimieren.
Die zentralen Felder sind maschinelles Lernen, die Digitalisierung logistischer Prozesse (Logistik 4.0) und die statistische Analyse von Speditionsdaten.
Das primäre Ziel ist es, den am besten geeigneten KI-Algorithmus zu ermitteln, um die Tonnage pro Woche für spezifische Abholgebiete präzise zu prognostizieren.
Der Autor nutzt einen empirischen Ansatz, bei dem historische Transportdaten mit verschiedenen Machine-Learning-Verfahren (u.a. Lineare Regression, Random Forests, Gradient Boosting, Neuronale Netze) trainiert und verglichen werden.
Der Hauptteil umfasst die detaillierte Datenbereinigung, die Auswahl und Modellierung von Prädiktoren sowie die technische Umsetzung der Algorithmen mittels Python.
Wichtige Begriffe sind Tonnagevorhersage, Logistik 4.0, Machine Learning, Predictive Analytics und Entscheidungsbäume.
Die Quelldaten enthalten unrealistische Werte (z.B. falsche Gewichtsangaben bei Pauschaltarifen), die das Modell verfälschen würden und daher vor der Anwendung der Algorithmen entfernt werden müssen.
Nach Ansicht des Autors sind Entscheidungsbäume mit Gradient Boosting für die gegebene Problemstellung am besten geeignet, da sie eine Balance zwischen Genauigkeit und Komplexität bieten.
Der GRIN Verlag hat sich seit 1998 auf die Veröffentlichung akademischer eBooks und Bücher spezialisiert. Der GRIN Verlag steht damit als erstes Unternehmen für User Generated Quality Content. Die Verlagsseiten GRIN.com, Hausarbeiten.de und Diplomarbeiten24 bieten für Hochschullehrer, Absolventen und Studenten die ideale Plattform, wissenschaftliche Texte wie Hausarbeiten, Referate, Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Dissertationen und wissenschaftliche Aufsätze einem breiten Publikum zu präsentieren.
Kostenfreie Veröffentlichung: Hausarbeit, Bachelorarbeit, Diplomarbeit, Dissertation, Masterarbeit, Interpretation oder Referat jetzt veröffentlichen!

