Diplomarbeit
Inhaltsverzeichnis
Inhaltsverzeichnis
EIDESSTATTLICHE ERKLÄRUNG 2
BESCHREIBUNG DER THEMENSTELLUNG 3
INHALTSVERZEICHNIS 4
ABBILDUNGSVERZEICHNIS 5
TABELLEN /GLEICHUNGSVERZEICHNIS 7
VORWORT 8
1 EINLEITUNG 10
2 ANALYSE 13
2.1 EINFÜHRUNG 13
2.2 DATENVERARBEITUNG MITTELS SPSS FÜR WINDOWS 14
2.3 DAS DATENMATERIAL 15
2.3.1 AUFBEREITUNG DES DATENMATERIALS ZUR ANALYSE 16
2.3.2 KORREKTUR DES INKONSISTENTEN DATENMATERIALS 18
2.3.3 CHARAKTERISTISCHE DATENAUFTEILUNG 19
2.3.4 CHARAKTERISTIKEN 20
2.3.4.1 Verteilungen 20
2.4 ZEITREIHEN 42
2.4.1 STATIONARITÄT DER ZEITREIHE 43
2.4.2 SPEKTRALANALYSE 44
2.4.3 EMPIRISCHE MOMENTE 1. UND 2. ORDNUNG DER ZEITREIHE 49
2.4.4 ZUSAMMENHANGSANALYSE 50
2.4.4.1 Streudiagramme (Scatterplots) 50
2.4.4.2 Korrelogramme 57
3 PROGNOSEVERFAHREN/ MODELLE 67
Seite 4
Diplomarbeit
Abbildungsverzeichnis
3.1 BEURTEILUNGSMETHODEN FÜR DIE PROGNOSEQUALITÄT 69
3.1.1 EX-ANTE BEURTEILUNG 69
3.1.2 EX-POST BEURTEILUNG 70
3.2 UNIVARIATE PROGNOSEVERFAHREN 72
3.2.1 DIE NAIVE PROGNOSE 72
3.2.2 PROGNOSE DURCH GLEITENDEN DURCHSCHNITT 80
3.2.3 EXPONENTIELLE GLÄTTUNG 83
3.3 MULTIVARIATE PROGNOSEVERFAHREN 89
3.3.1 MULTIPLE REGRESSIONSANALYSE 90
3.3.2 ADAPTIVE FILTERSYSTEME 93
3.4 HEURISTISCHE PROGNOSEVERFAHREN 94
4 ZUSAMMENFASSUNG 96
LITERATURLISTE 98
ANHANG 101
Abbildungsverzeichnis
Abbildung 2 1 : Histogramm zur Netto-Erzeugerleistung im Gesamtzeitraum 21
Abbildung 2 2 : Histogramm zur Netto-Erzeugerleistung an Wochentagen ohne Feiertage 22
Abbildung 2 3 : Histogramm zur Netto-Erzeugerleistung an Wochenenden und Feiertagen 22
Abbildung 2 4 : Balkendiagramm Leistungsstufen Gesamtzeitraum 24
Abbildung 2 5 : Relative Leistungsstufenverteilung im Gesamtzeitraum 25
Abbildung 2 6 : Relative Leistungsstufenverteilung an ferienfreien Tagen 25
Abbildung 2 7 : Relative Leistungsstufenverteilung im Bereich ϑ A 0 C 26
Abbildung 2 8 : Relative Leistungsstufenverteilung im Bereich 0 C ϑ A 20 C 27
Abbildung 2 9 : Relative Leistungsstufenverteilung im Bereich ϑ A 20 C 27
Abbildung 2 10 : Temperaturverteilung ohne Wochenenden und Feiertage 28
Abbildung 2 11 : Relative Leistungsstufenverteilung auf Temperaturbereiche 29
Abbildung 2 12 : Systemdynamik Jan. 95 bis Dez. 96 30
Abbildung 2 13 : Schwankung um Mittelwert 32
Abbildung 2 14 : Schwankungsintervall 32
Abbildung 2 15 : Verlauf der 19 :00 Uhr-Werte über den Gesamtanlysezeitraum 33
Abbildung 2 16 : Histogramm zur halbstündigen Laständerung 35
Abbildung 2 17 : Histogramm zur stündlichen Laständerung 36
Abbildung 2 18 : Verteilung der Laständerung bei P/h 50 MW/h auf den Tag 36
Abbildung 2 19 : Verteilung der Laständerung bei P/h 50 MW/h auf den Tag 37
Abbildung 2 20 : Verteilung der Laständerung bei P/h 50 MW/h auf den Tag 38
Abbildung 2 21 : P/h 50 MW/h im Bereich 6 00 bis 8 00 Uhr 39
Abbildung 2 22 : P/h 50 MW/h im Bereich 23 30 bis 01 30 Uhr 40
Abbildung 2 23 : P/h 50 MW/h im Bereich 14 00 bis 14 30 Uhr 41
Seite 5
Diplomarbeit
Abbildungsverzeichnis
Abbildung 2 24 : P/h 50 MW/h im Bereich 20 30 bis 22 00 Uhr
Abbildung 2 25 : Integrierte Leistungswerte
Abbildung 2 26 : Spektraldichte der mittleren Tagesleistung
Abbildung 2 27 : Spektraldichte der Halbstunden-Leistungswerte
Abbildung 2 28 : Spektraldichte der mittleren Tagesleistung ohne Wochenenden
Abbildung 2 29 : Charakteristischer Verlauf der mittleren Tagesleistungen
Abbildung 2 30 : Scatterplot Leistung-Außentemperatur
Abbildung 2 31 : Scatterplot Leistung-Windgeschwindigkeit
Abbildung 2 32 : Scatterplot Leistungsbedarf-Windrichtung
Abbildung 2 33 : Scatterplot Leistung-Luftfeuchtigkeit
Abbildung 2 34 : Scatterplot Außentemperatur-Luftfeuchtigkeit
Abbildung 2 35 : Scatterplot Außentemperatur-Windrichtung
Abbildung 2 36 : Scatterplot Außentemperatur-Windgeschwindigkeit
Abbildung 2 37 : Scatterplot Luftfeuchtigkeit-Windgeschwindigkeit
Abbildung 2 38 : Korrelogramm Leistung-Außentemperatur
Abbildung 2 39 : Korrelogramm Leistung-Windgeschwindigkeit
Abbildung 2 40 : Korrelogramm Leistung-Luftfeuchtigkeit
Abbildung 2 41 : (Auto ) Korrelogramm der Erzeugerleistung bis 7 Tage
Abbildung 2 42 : (Auto ) Korrelogramm der Erzeugerleistung bis 24 Stunden
Abbildung 3 1 : Abweichungsmittelwert der naiven Prognose
Abbildung 3 2 : Mittelwert des Abweichungsbetrages der naiven Prognose
Abbildung 3 3 : Naive Prognose
Abbildung 3 4 : Verlauf des mittleren Prognosefehlers über Gesamtzeitraum
Abbildung 3 5 : Verteilung des Prognosefehlers
Abbildung 3 6 : Tagesverteilung der Prognosefehler 10
Abbildung 3 7 : Prognose mit Feiertagen
Abbildung 3 8 : Prognose ohne Feiertage
Abbildung 3 9 : Mittlere absolute Abweichung als Funktion von α
Abbildung 3 10 : Abweichungsmittelwert der exponentiellen Glättung (Stunde zu Stunde)
Abbildung 3 11 : WMQA-Wert als Funktion von α
Abbildung 3 12 : Abweichungsmittelwert der exponentiellen Glättung (Tag zu Tag/ mit Feiertag)
Abbildung 3 13 : Abweichungsmittelwert der exponentiellen Glättung (Tag zu Tag/ ohne Feiertag)88
Abbildung 3 14 : Scatterplot Leistung-Außentemperatur (Tagesmittelwerte)
Abbildung 3 15 : Prognose durch lineare Einfachregression
Abbildung A 1 : Leistungsverteilung an Montagen
Abbildung A 2 : Leistungsverteilung an Dienstagen
Abbildung A 3 : Leistungsverteilung an Mittwochen
Abbildung A 4 : Leistungsverteilung an Donnerstagen
Abbildung A 5 : Leistungsverteilung an Freitagen
Abbildung A 6 : Leistungsverteilung an Samstagen
Abbildung A 7 : Leistungsverteilung an Sonntagen
Abbildung A 8 : Leistungsmittelwerte sortiert nach Wochentagen im Gesamtzeitraum
Abbildung A 9 : Verlauf der 11 :30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 10 : Verlauf der 17 :30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 11 : Verlauf der 19 :30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 12 : P/h 50 MW/h im Bereich 6 00 bis 8 00 Uhr ( Ferienbetrachtung )
Abbildung A 13 : Korellogramm Außentemperatur-Windgeschwindigkeit
Abbildung A 14 : Korrelogramm Außentemperatur-Windrichtung
Abbildung A 15 : Korrelogramm Außentemperatur-Luftfeuchtigkeit
Seite 6
Diplomarbeit
Tabellen /Gleichungsverzeichnis
Tabellen /Gleichungsverzeichnis
TABELLEN
Tabelle 2 1 : Kraftwerkseigenleistungen 17
Tabelle 2 2 : Temperaturklassifikation 29
Tabelle 2 3 : Empirische Momente 50
Tabelle 2 4 : Kreuzkorrelationskoeffizienten 60
Tabelle 3 1 : Prognose mit Feiertagen (Fehlerkenngrößen) 81
Tabelle 3 2 : Prognose ohne Feiertage (Fehlerkenngrößen) 82
Tabelle 3 3 91
GLEICHUNGEN
Gl. 2 1 : Arithmetischer Mittelwert 49
Gl. 2 2 : Varianz 49
Gl. 2 3 : Standardabweichung 49
Gl. 2 4 : Empirische Kovarianz 58
Gl. 2 5 : Empirischer Korrelationskoeffizient 58
Gl. 2 6 : Korrelationskoeffizient von Bravais-Pearson 58
Gl. 2 7 : Kreuzkorrelationskoeffizient von Bravais-Pearson 60
Gl. 2 8 : Zeitverschiebung (Time-Lag) 61
Gl. 2 9 : Autokovarianzfunktion 64
Gl. 2 10 : Autokorrelationsfunktion (AKF) 64
Gl. 3 1 : Prognosefehler: 70
Gl. 3 2 : Absoluter Prognosefehler: 70
Gl. 3 3 : Quadratischer Prognosefehler: 70
Gl. 3 4 : Relativer absoluter Prognosefehler: 70
Gl. 3 5 : Mittlere absolute Abweichung (MAA): 71
Gl. 3 6 : Mittlere quadratische Abweichung (MQA): 71
Gl. 3 7 : Wurzel aus der mittleren quadratischen Abweichung (WMQA): 71
Gl. 3 8 : Ungleichheitskoeffizient von Theil (U): 71
Gl. 3 9 : Konstantes Modell der exponentiellen Glättung 83
Gl. 3 10 : Lineare Einfachregression 91
Seite 7
Vorwort
Die Stadtwerke Bremen AG - mittlerweile 143 Jahre alt - versorgt die Stadt Bremen seit vielen Jahren neben Gas, Trinkwasser und Fernwärme auch mit elektrischer Energie (Strom). Dabei sind die drei Kriterien der Wirtschaftlichkeit, des Umweltschutzes und der Versorgungssicherheit von essentieller Bedeutung für den Erfolg und die Leistungsfähigkeit des Unternehmens und deshalb auch die festgeschriebenen Unternehmensziele.
Für die Versorgungssicherheit ist vor allem präzise gewartetes Equipment, gut geschultes und stets einsatzbereites Personal von Wichtigkeit. Durch den Einsatz modernster und ökonomischer Technik, Kontrolle sämtlicher Emissionswerte der Kraftwerke und die Durchführung erforderlicher Korrekturmaßnahmen können auf dem Gebiet des Umweltschutzes große Erfolge erzielt werden. Die Wirtschaftlichkeit des Unternehmens wird dadurch erreicht, daß die Preise für Strom, Wasser, Gas und Wärme einerseits kundenfreundlich, andererseits aber auch so bemessen sind, daß wichtige Investitionen für die Zukunft und die Betriebsbereitschaft sämtlicher Anlagen getätigt werden können.
Anders als andere Unternehmen, deren Umsatz im wesentlichen vom Angebots/Nachfrage-Verhältnis der erzeugten Produkte abhängt, ist die Stadtwerke Bremen AG -so wie andere EVU auch- dazu verpflichtet, dem Verbraucher ihr Produkt (Energie und Trinkwasser) in ausreichender Menge zur Verfügung zu stellen und zwar rund um die Uhr. Das Angebot kann hier nicht alleine dadurch geregelt werden, daß die Nachfrage beobachtet wird, sondern es muß -wenn möglich- genau bekannt sein, wie der Verlauf der Nachfrage in der Zukunft aussehen wird. Auf unterschätzten Bedarf kann ein Erzeuger-EVU nämlcih nur allzu träge reagieren und ein Überangebot ist mit großen finanziellen Verlusten verbunden, da nach heutigem Stand der Technik eine ökologische wie auch ökonomische Energiespeicherung in großem Maße nicht vollzogen werden kann.
Die Prognose des Energiebedarfs der Stadt Bremen ist also eine für die Wirtschaftlichkeit des Unternehmens Stadtwerke Bremen AG eine sehr wichtige, aber auch sehr komplexe und komplizierte Angelegenheit. Derzeit wird die für die tägliche Kraftwerkseinsatzplanung erforderliche Tageslastgangkurve per Hand von Mitarbeitern des Lastverteilers angefertigt und hat mit ca 95% eine sehr hohe Vorhersagequalität. Dabei ist die Prognose natürlich stark von der sie anfertigenden Person abhängig; Faktoren wie die langjährige Erfahrung des betreffenden Mitarbeiters und die subjektive Bewertung des Witterungseinflußes bestimmen maßgeblich die Qualität der Vorhersage.
Seite 8
Um den Mitarbeitern die Aufgabe der Tageslastprognose - wenn auch nicht abzunehmenwenigstens zu vereinfachen, soll mit der vorliegenden Diplomarbeit die grundlegende Untersuchung gemacht werden, ob und mit welchen Mitteln ein automatisiertes Prognosesystem erstellt und eingesetzt werden kann und welche Vorraussetzungen dafür gelten müssen. Die Qualität der durch das System gemachten Prognosen muß natürlich mindestens die der Mitarbeiter erreichen, da erst dann an einen Einsatz im täglichen Betrieb des Lastverteilers denkbar und sinnvoll ist.
Ich möchte mich hiermit bei allen direkt und indirekt beteiligten Personen, innerhalb, wie außerhalb der Stadtwerke Bremen AG bedanken, speziell jedoch bei dem Abteilungsleiter des Lastverteilers und dessen zugehörigen Stellen, Herrn Andre Becker, der die Bearbeitung dieser Diplomarbeit durch meine Person erst möglich gemacht hat und mir stets mit Rat und Tat zur Seite stand.
Ganz spezieller Dank gilt auch meinem betreuenden Dozenten, Herrn Prof. Dr. Rausnitz, der ebenfalls großen Einfluß auf die Realisation der vorliegenden Diplomarbeit gehabt, und mich während der Bearbeitungsphase -vielle icht unwissentlich- motiviert hat weiterzumachen.
Seite 9
Diplomarbeit
1 Einleitung
1 Einleitung
Die Versorgung der Stadt Bremen mit elektrischer Energie erfolgt zu 90% durch die Stadtwerke Bremen AG, die restlichen 10% werden -vertraglich festgeschrieben- von der Preußen Elektra AG gelie fert. Insgesamt werden jährlich rund 3,4 Mrd kWh elektrischer Energie in der Stadt Bremen benötigt, wobei jedoch in etwa ein Drittel dieser Energiemenge alleine von den Stahlwerken Bremen konsumiert werden.
Die Erzeugung der elektrischen Energie erfolgt -einsatzoptimiert- durch die Verbrennung von Steinkohle oder Erdgas, oder durch den Einsatz von sog. Gasturbinen, die durch die bei der Verbrennung von leichtem Heizöl entstehenden Abgase angetrieben werden.
Bei der Stahlschmelze in den Hochöfen der Stahlwerke Bremen entsteht bei der Gewinnung reinen Eisens (durch Reduktion des Eisenerzes) sog. Gichtgas (etwa 60 Vol% N 2 , 30 Vol% CO und 10 Vol% CO 2 ), welches für die Erzeugung elektrischer Energie einen noch genügend hohen Brennwert hat. Die im Gichtgas steckende Energie wird mittels 16 2/3 Herz-Generatoren in elektrische Energie umgewandelt und direkt in das Netz der Bahn AG eingespeist. Seit Herbst 1995 steht auf dem Gelände des Kraftwerks Mittelsbühren ein statischer Umrichter, der es ermöglicht, den 16 2/3 Hz-Einphasenwechselstrom der Bahn, in 50 Hz-Drehstrom, wie er an Haushalte und Industrie geliefert wird, zu konvertieren und umgekehrt. Damit ist es nun möglich, bei Minderbedarf der Bahn AG, z.B. an Wochenenden, die überschüßige Energie in das Stadtnetz Bremen einzuspeisen, anstatt sie einfach verpuffen zu lassen 1 .
Das größte Problem mit dem sich alle Erzeuger-EVUs beschäftigen müssen, ist die Einsatzplanung der zur Verfügung stehenden Kraftwerke und die Einhaltung der mit Verbundnetzen abgeschlossenen Verträge, so daß sich ein Kostenoptimum für jeden einzelnen Tag und in der Jahresbilanz ergibt.
Dieses Optimum ist dabei von vielen Faktoren abhängig, von denen hier nur einige erwähnt werden sollen:
• welche Leistung wird benötigt,
• wann wird die Leistung benötigt,
1 Das überschüßige Gas wird einfach nur verbrannt, damit es nicht in die Umwelt gelangt.
Seite 10
Diplomarbeit
1 Einleitung
• wie lange muß die Leistung bereitgestellt werden,
• welches Kraftwerk hat welche Betriebskosten,
• wie hängen die Betriebskosten eines KWs von dessen Auslastung ab,
• welche Anfahrzeit hat welches Kraftwerk,
• was kostet das Anfahren des Kraftwerks,
• welche Kraftwerke sind überhaupt einsatzbereit,
• müssen Verträge mit Fremdversorgern eingehalten werden,
• wann kann die Fremdenergie am kostengünstigsten abgenommen werden...?
Selbst bei der Annahme, daß oben erwähnte Punkte zu Genüge bekannt und in allen denkbaren Kombinationen durchkalkuliert wurden, so ist die Qualität der Optimierung immer noch stark von der Vorhersage des Energiebedarfs des zu versorgenden Gebietes abhängig.
Und hier liegt auch die größte Schwierigkeit, denn der Energieverbrauch einer Stadt wie Bremen ist letztlich nicht nur von der Zeit und vielen weiteren kausalen Einflüssen abhängig, sondern unterliegt auch gewissen stochastischen Schwankungen, deren Bestimmung (Schätzung) in das Gebiet der Wahrscheinlichkeitstheorie und Statistik fällt, und somit -allen gestellten Erwartungen zum Trotz- niemals 100% ig vollzogen werden kann. Vielmehr ist die genaue Vorhersage eines zufälligen Prozesses wiederum ein zufälliges Ereignis, was sich zwar wiederholen kann, aber nicht muß.
Bei der Erstellung eines Prognosesystems stellt sich zunächst einmal die Frage, welche Arten von angewandten Prognoseverfahren sind bereits bei anderen EVUs im Einsatz, bzw. welche Verfahren sind überhaupt geläufig. Das nächste Problem ist die Auswahl eines adäquaten Prognosemodells aus der Vielzahl gängiger Methoden.
Die Komplexität der verschiedenen Prognoseverfahren und die schlechte Interpretierbarkeit der aus Untersuchungen vorliegenden Ergebnisse, erschweren die Auswahl eines geeigneten Verfahrens, da die ex-ante Beurteilung der Prognosequalität in ihrer Wertigkeit stets davon abhängig ist, welche Art der Beurteilung angewandt wird. So gibt es eigentlich zu jedem Prognoseverfahren eine Bewertungscharakteristik, die dem untersuchten Verfahren eine gewisse Existenzgrundlage gibt. So kann die niedrige quantitative Vorhersagegenauigkeit
Seite 11
Diplomarbeit
1 Einleitung
eines getesteten Verfahrens durch dessen einfache Implementierung, zu einem insgesamt befriedigenden Ergebnis gebracht werden.
Die erwähnte Komplexität der Prognoseverfahren läßt eine empirische Ermittlung des günstigsten Verfahrens nicht zu, da die Anwendung jedes dieser Verfahren -sofern es sich nicht um einfache autoregressive Prognosemodelle, wie beispielsweise die exponentielle Glättung oder simple Berechnung gleitender Durchschnitte handelt- mit hohem Aufwand verbunden ist.
Durch die Betrachtung des zu prognostizierenden Systems mit all seinen Komponenten und die genaue Analyse der äußeren Einflußfaktoren, erhält man einen Überblick über die Komplexität des am besten geeigneten Prognoseverfahrens und kommt dadurch automatisch zu einer Vorabselektion aller in Frage kommenden Modelle. Anschließend braucht man sich dann nur noch für eines dieser Modelle zu entscheide, welches dann auf die gegebenen Umstände anpzuassen ist. Der Ausdruck „nur“ ist dabei mit äußerster Vorsicht zu genießen, da es auch nach vielen Jahren der Anwendung etwaiger Prognoseverfahren noch immer keines gibt, welches dem Anspruch der idealen Prognose gewachsen ist.
Seite 12
Diplomarbeit
2 Analyse
2.1 Einführung
Bevor eine Entscheidung für ein bestimmtes Prognosesystem getroffen werden kann oder sollte, bietet es sich an, eine eingehende Analyse des zur Prognose bereitstehenden Datenmaterials zu erwägen.
Der Nutzen dieser Datenanalyse liegt auf der Hand; so ist es für den hier betrachteten Fall der Tageslastprognose von essentieller Bedeutung, ob sich beispielsweise alle Tage gleich verhalten oder unterschiedliche Tagescharakteristiken bestehen. Das Ergebnis dieser Analyse zeigt dann, ob das anzuwendende Prognoseverfahren entlang der Zeitreihe eingesetzt werden kann oder sollte, oder ob eine Prognose quer durch die Zeitreihe, also entlang den verschiedenen Wochentagen 2 von Nöten ist.
Die Analyse gibt aber auch Auskunft über den Zusammenhang zwischen abhängigen und unabhängigen Variablen, so daß von vornherein eine Entscheidung über die Notwendigkeit der Berücksichtigung etwaiger Fremdeinflüsse getroffen werden kann. Für jede vermeintliche Einflußgröße, die sich durch die Analyse als nicht signifikant erweist, nimmt der Implementierungsaufwand des Prognosesystems stark ab, wohingegen die Einberechnung dieser Faktoren keine großen Verbesserungen hinsichtlich der Prognosequalität mit sich bringt.
Anmerkung: Die hier dargestellten Grafiken sind nur eine Auswahl einer großen Anzahl der Analysen, die bei der Datenbetrachtung gemacht wurden, und eine sehr kleine Auswahl derer Untersuchungen, die prinzipiell hätten gemacht werden können. Es ist als Statistik-Einsteiger und Neuling auf dem Gebiet der elektrischen Energieversorgung äußerst schwierig, eine Auswahl adäquater Untersuchungen zu treffen, so daß sehr viele Untersuchungen (ca. 80%) nicht die erwarteten Ergebnisse geliefert haben und deshalb sofort ad acta gelegt wurden. Es gibt aber auch keine Leitregeln zur spezifischen Datenanalyse, weshalb die Kreativität des Analytikers ganz besonders gefragt ist.
Die Ideen zu den meisten der beschriebenen Analysen ergaben sich spontan während der Bearbeitung oder aus der Auswertung bereits durchgeführter Untersuchungen, oder bei
2 Im weiteren Verlauf wird in zweideutiger Weise der Begriff Wochentage benutzt: Wochentage im Sinne von Arbeitstagen und Wochentage im Sinne von Tagen der gesamten Woche (Mo - So). Die jeweilige Bedeutung geht (hoffentlich) aus dem jeweiligen Kontext hervor.
Seite 13
Diplomarbeit
sonstigen Datenbearbeitungen, wie zum Beispiel der Datenkorrektur. Aus diesem Grunde ist auch eine strikte Trennung der Analyse von anderen in dieser Arbeit abgehandelten Kapiteln nicht möglich und sicherlich auch nicht sinnvoll, so daß der Leser auch an anderer Stelle Datenanalysen finden wird, die in diesem Kapitel hätten abgehandelt werden können.
2.2 Datenverarbeitung mittels SPSS für Windows
Das Programmsystem SPSS für Windows ist ein Statistikprogramm, welches sich aus dem Basismodul und verschiedenen Einzelmodulen zusammensetzt. Das Basismodul stellt dabei zunächst nur die "einfachen" deskriptiven und explorativen Datenanalyseverfahren zur Verfügung; weitergehende Untersuchungen wie die Multiple Regressionsanalyse oder die Spektralanalyse sind nur mit speziellen Erweiterungsmodulen möglich, die einzeln oder im Bundle erworben werden können.
Die zusätzlichen Module sind im einzelnen
• SPSS Professional Statistics ™
• SPSS Advanced Statistics ™
• SPSS Tables ™
• SPSS Trends ™
• SPSS Categories ™
• SPSS CHAID ™
• SPSS LISREL ® 7
wobei hier nicht auf deren Inhalt und Funktionen weiter eingegangen werden soll.
Der Umgang mit SPSS geht nach einer ersten Eingewöhnungsphase recht leicht von der Hand und läßt dem Benutzer viel Spielraum im funktionellen Umgang mit den zu analysierenden Daten, allerdings nur bezogen auf vollständige Zeitreihen oder Merkmale und nicht auf einzelne Fälle (SPSS-Bezeichnung für jeden zusammengehörigen Datensatz). Das Programmsystem eignet sich sowohl für die rein statistische Datenanalyse und die Verwaltung der zugehörigen Daten, als auch für die Untersuchung von Zeitreihen, so wie sie hier gemacht wurde.
Während der Arbeit mit SPSS stellte sich heraus, daß das Programm zwar -im Gegensatz zu MS Excel- in der Lage ist, die anfallende Datenflut (>35.000 Datensätze bei 2 Jahren
Seite 14
Diplomarbeit
Analysezeitraum) zu beherrschen, jedoch große Systemresourcen von Nöten sind; ein 80486-Rechner mit 8MB Arbeitsspeicher war bei vielen Aktionen zu langsam. So kam es sehr häufig zu Programm- oder gar Systemabstürzen, aufgrund mangelnden Arbeitsspeichers, wodurch viele aufwendige Analysen wiederholt werden mußten.
Ein großes Manko des Programmsystems SPSS ist auch die Einschränkung im Umgang mit den häufig verwendeten Charts; die einzige Möglichkeit die bearbeiteten Grafiken in eine verwendete Textverarbeitung einzufügen, ist der Umweg über die Windows-Zwischenablage. Dies ist besonders bei Analysen des gesamten Datenmaterials sehr zeitintensiv (Spitzenwert 15 Minuten) und bedarf eines großen Arbeitsspeichers, da es ansonsten auch hier zu Programmabstürzen kommen kann (und in der Regel auch kommt).
Kommentar zu SPSS für Windows: Die beschriebene Problematik beim Umgang mit SPSS
wurde erst mit zunehmender Grundkenntnis des Systems und der damit verbundenen besseren Ausnutzung der integrierten Funktionalität immer deutlicher, weshalb ein Applikationswechsel für den vorgegebenen bzw. noch verbleibenden Bearbeitungszeitraum sicherlich zu spät gewesen wäre. Es bleibt aber anzumerken, daß mit Sicherheit schnellere und praktischere Statistiksoftware zu realisieren oder vielleicht sogar schon auf dem Markt erhältlich ist.
Es stellt sich jedenfalls die Frage, welche Rechnerkpazität die Macher von SPSS für Windows voraussetzen, damit das Programmsystem einwandfrei läuft. Sicherlich ist eine Datenmenge von ca. 35.000 Fällen schon ganz anständig, gehört angesichts der bei Volksbefragungen auftretenden Daten (ein Hauptanwendungsfeld der Statistik und der dazugehörigen Software) aber eher zu den Kleineren 3 .
2.3 Das Datenmaterial
Das für die Analyse zur Verfügung stehende Datenmaterial stammt aus der Archivierung der Kraftwerks-Emissionswerte auf einem zentralen Umweltrechner innerhalb der Stadtwerke Bremen. In jedem einzelnen Kraftwerk steht ein Emissionsrechner, der die dort anfallenden Meßwerte erfaßt und via DFÜ an den Zentralrechner überträgt. Neben den Emissionswerten werden auch die gemittelten halbstündigen Erzeugerleistungen der einzelnen Blöcke, und im Kraftwerk Hafen noch die vor Ort gemessenen Wetterparameter
3 Eines der "großen" Leistungsmerkmale des SPSS-Systems ist laut Hersteller die uneingeschränkte Anzahl zu analysierender Fälle.
Seite 15
Diplomarbeit
• Außentemperatur
• Windgeschwindigkeit
• Windrichtung
• Niederschlag
viertelstündlich erfaßt.
Zusätzlich zu den genannten Daten aus den Emissionsrechnern, stehen noch die zur Kostenabrechnung benötigten viertelstündlichen Energieverbrauchswerte der Stahlwerke Bremen und die vom Lastverteiler-Personal angefertigten subjektiven Wetterbewertungen (heiter, wolkig, Regen...) nebst täglichen Niederschlagsmengen zur Verfügung.
Über telefonische und schriftliche Korrespondenz mit dem Deutschen Wetterdienst wurde des weiteren versucht, Archivdaten über die Bewölkungsverhältnisse in der Stadt Bremen inklusive etwaiger Beleuchtungsdaten zu bekommen, was jedoch durch den hohen Preis (> 4.500 DM) und der Unsicherheit der Effektivität im Sande verlief
2.3.1 Aufbereitung des Datenmaterials zur Analyse
Zwecks Verarbeitung und Analyse mußten die genannten Daten zunächst per DDE vom Umweltrechner geladen und i n eine Datentabelle des Tabellenkalkulationsprogramms MS Excel geschrieben werden 4 , von wo aus sie wiederum in das für die eigentliche Datenanalyse zur Verfügung stehende Programmsystem SPSS für Windows transferiert wurden (siehe auch Kapitel 2.1).
Da für die Analyse nicht die Erzeugerleistungen jedes einzelnen Kraftwerks von Bedeutung sind, sondern nur die Gesamterzeugerleistung aller einspeisenden Energiequellen, wurden die genannten Einzelwerte aufsummiert und erst dann an das Statistikprogramm SPSS weitergegeben.
Vor der genannten Aufsummierung der Einzelwerte mußte zunächst der Eigenbedarf der Kraftwerksblöcke aus den Leistungswerten herausgerechnet werden (Berechnung der Netto-Erzeugerleistung), da dieser dem Endverbraucher nic ht zur Verfügung steht, und somit die Ergebnisse verfälschen würde. Beim Einsatz eines Prognosesystems muß dann lediglich der Eigenbedarf des Kraftwerks wieder hinzugerechnet werden, um die tatsächlich zu
4 Der Transfer in das Programm MS Excel war programmtechnisch unabdingbar
Seite 16
Diplomarbeit
erzeugende Leistung zu erhalten. Dies passiert natürlich erst bei der täglichen Kraftwerkseinsatzplanung/-optimierung, weil der Eigenbedarf von der jeweils eingesetzten Maschine abhängt und nicht pauschal zu bemessen ist.
Der Eigenbedarf der Kraftwerksblöcke wurde dabei mit einem festen Prozentsatz angenommen, der zunächst einmal davon abhängig ist, um welchen Kraftwerkstypen es sich handelt. Dieser Eigenbedarf des betreffenden Kraftwerks ist natürlich nicht konstant, sondern hängt ganz wesentlich vom Belastungsgrad und der Einsatzdauer ab. Eine genaue Analyse und Einberechnung des Eigenbedarfs als Funktion verschiedener Parameter hätte jedoch im Verhältnis zum entstandenen Aufwand nicht den großen Nutzen gehabt (vor allem aufgrund der später beschriebenen Dateninkonsistenz), weshalb hier darauf verzichtet wurde.
Die Abrechnung der Eigenbedarfswerte ergibt sich aus der folgenden Aufstellung:
Tabelle 2.1: Kraftwerkseigenleistungen
Die weiter oben beschriebene, teilweise nicht zu umgehende Vorgehensweise beim Umgang mit den Daten brachte zwei wesentliche Handling-Probleme mit sich:
1. Die Tabellenkalkulation MS Excel ist nur in Lage Zeitreihen mit maximal 16.384 Werten auf einmal aufzunehmen, was bei halbstündigen Werten in etwa 10 Monaten entspricht und bei einem angepeilten Betrachtungszeitraum von 3½ Jahren eine Aufteilung auf 4 Excel-Dateien erforderlich macht, wodurch wiederum alle Berechnungen viermal gemacht werden mußten.
2. Der Transfer der Daten von MS Excel zu SPSS für Windows mußte über die MS Windows Zwischenablage geschehen, was sich als relativ langwieriger Prozeß herausstellte
Da sich sämtliche Betrachtungen auf den Leistungsbedarf der Stadt Bremen, ohne die Stahlwerke beziehen sollen, mußten die nun im SPSS-System stehenden Daten noch um den Anteil der Stahlwerke bereinigt werden, was (sogar mit SPSS) denkbar einfach war, da es sich hierbei um eine simple Subtraktion handelte. Bevor allerdings diese Berechnung
5 Die hier gemachten Angaben sind Erfahrungswerte des Lastverteiler-Personals
Seite 17
Diplomarbeit
durchgeführt werden konnte, mußten die viertelstündlichen Energieverbrauchswerte der Stahlwerke Bremen auf Halbstundenwerte dezimiert werden. Dies wurde durch simple gleitende Durchschnittsberechnung aus jeweils 2 Werten und nachfolgende Eliminierung jedes zweiten Wertes erreicht.
2.3.2 Korrektur des inkonsistenten Datenmaterials
Eine sich bei der später beschriebenen Datenanalyse herausstellende Problematik war die der Dateninkonsistenz. Durch anfallende Reparaturarbeiten, TÜV-Inspektionen oder einfach durch einen kurzzeitigen Ausfall der Rechneranlage, kommt es in unregelmäßigen Zeitabständen zu Ausfällen der Datenerfassung, wodurch die insgesamt archivierten Datenbestände zwar größtenteils nur kleine Unstimmigkeiten, des häufigeren jedoch auch große Verfälschungen aufwiesen. Dies ist seitens der Stadtwerke ohne Probleme zu vertreten, da die Leistungsdaten momentan nur zu statistischen Zwecken erfaßt werden.
Die Problematik bei der Bearbeitung inkonsistenter Daten liegt auf der Hand 6 ; sämtliche
Analyseergebnisse sind unterschiedlich stark verfälscht und können nicht nach Güte eingestuft werden, weshalb eine Nachbearbeitung zwingend notwendig ist.
Die größten Probleme der Datenaufbereitung sind mit Abstand die der Detektio und der Lokalisierung der fehlerbehafteten Daten. Fällt beispielsweise bei einer TÜV-Inspektion lediglich eine Datenquelle (= erzeugte Leistung eines Blocks) für die Erfassung aus, so fällt dies in der Gesamtsumme der Erzeugerdaten unter Umständen gar nicht ins Gewicht, denn Leistungssprünge von bis zu 50 MW innerhalb einer halben Stunde sind keine Seltenheit im betrachteten Versorgungsgebiet (siehe dazu auch Kapitel 2.3.4 Charakteristiken ab Seite 20).
Trotzdem wurde eine Korrektur der Daten unter Zuhilfenahme großer (vermeintlicher) Laständerungen vorgenommen, die sich in folgenden Schritten vollzog:
1. Der gesamte Datensatz der Netto-Erzeugerwerte wurde auf Leistungssprünge ≥50 MW innerhalb einer halben Stunde, also von einem Wert zum Nächsten, und auf Leistungssprünge ≥80 MW innerhalb einer ganzen Stunde hin untersucht und gegebenenfalls gekennzeichnet.
2. Vergleich der markierten Leistungsdaten mit den vom Lastverteiler-Personal per Hand in den sog. Lastverteiler-Ablesebogen eingetragenen 1-Stunden-Werten und Korrektur der Daten anhand der extrapolierten 1-Stunden-Werte, sofern dies erforderlich war.
6 Siehe auch Kapitel 2.3.3: Charakteristische Datenaufteilung auf Seite 19
Seite 18
Diplomarbeit
Die Anzahl der so zu korrigierenden Daten belief sich auf ca. 1-2% des Gesamtdatensatzes, was deutlich macht, wie wichtig eine Vorabüberprüfung des zu analysierenden Datenmaterials ist.
2.3.3 Charakteristische Datenaufteilung
Bei der weiteren Betrachtung und Analyse des Datenmaterials wird es immer wieder zu Unterteilungen des Datenmaterials anhand verschiedener Charakteristiken kommen, d.h. die Daten werden nach bestimmten Gesichtspunkten gefiltert.
Dies ist besonders dann von Bedeutung, wenn weniger starke Zusammenhänge aufgedeckt werden sollen, die bei einer Betrachtung des gesamten Datenmaterials schlecht oder gar nicht zu erkennen sind. In diesen Fällen ist immer ein gewisses Maß an Fingerspitzengefühl von Nöten, da eine Filterung der Gesamtdaten immer auch eine Manipulation der Analyseergebnisse zur Folge hat 7 . Diese Tatsache darf bei der Gewichtung der
Zusammenhänge nicht vernachlässigt werden, da eine eindeutige Korrelation zum Beispiel auch bei der Betrachtung des gesamten Datenmaterials zu erkennen ist oder zumindest sein sollte.
Trotzdem ist die Datenfilterung ein unverzichtbares Hilfsmittel zur Aufdeckung etwaiger Kausalitäten. Teilweise macht sogar nur die Betrachtung gefilterter Daten einen Sinn, da zum einen -wie eine alte Weisheit ja richtiger Weise sagt- der Vergleich von Äpfeln und Birnen nur wenig nutzbare Erkenntnisse mit sich bringt, und zum anderen ist es stets anzuraten, innerhalb einer Analyse so viele Parameter wie möglich konstant zu halten, um hierdurch die Anzahl der aktiven Einflußgrößen zu minimieren.
Um einen Bezug zum hier untersuchten Datenmaterial zu bekommen, seien exemplarisch die folgenden Filterkriterien erwähnt:
Filterung nach
• Tageszeit (Uhrzeit),
• Temperatur,
• Luftfeuchtigkeit,
• Wochentagen, Wochenenden,
7 Dieser Umstand hat der Statistik auch den mehr oder weniger gerechtfertigten Ruf der Unzuverläßigkeit erbracht: "Traue keiner Statistik, die Du nicht selbst gefälscht hast“
Seite 19
Diplomarbeit
• Feiertagen,
• Jahreszeit und
• Urlaubszeit.
Sollte in der Analyse eine Filtervariable gesetzt sein, so wird dies explizit erwähnt, egal ob es sich um eine unabdingbare Filterung handelt (z.B. Betrachtung eines bestimmten Zeitraumes), oder ob die Aufteilung der Daten nur aufgrund der schlechten Sichtbarkeit bestimmter Zusammenhänge gemacht wurde.
2.3.4 Charakteristiken
Analog zu den in Kapitel 2.3.3 gemachten Äußerungen, sollen in diesem Kapitel die Daten hinsichtlich ihrer wesentlichen Charakteristiken untersucht und Rückschlüsse auf günstige Datenunterteilungen vorgenommen werden. Auch soll einmal prinzipiell festgestellt werden, in welchem Bereich die Prognose eher unsicher und in welchem Bereich eine „Prognose per Auge“ möglich sein wird.
Besonders wichtig dabei sind grafische Darstellungen, die -wie man ja weiß - mehr als tausend Worte sagen und deshalb auch im Vordergrund dieses Kapitels stehen.
2.3.4.1 Verteilungen
Eine für die Prognose sehr interessante Datencharakteristik ist die, wann und mit welcher Häufigkeit welche Leistung benötigt wird. Eventuell sind Gesetzmäßigkeiten die zur Prognosequalitätssteigerung herangezogen werden können aus dem Gesmatdatenmaterial herauszulesen, wobei natürlich deren Bestimmtheit 8 noch erfaßt werden muß.
8 Hiermit ist gemeint, wie stark dieses systematische Verhalten gewichtet werden darf.
Seite 20
Diplomarbeit
Abbildung 2.1: Histogramm zur Netto-Erzeugerleistung im Gesamtzeitraum
Wie Abbildung 2.1 zeigt, liegt die im Stadtgebiet Bremen benötigte Leistung innerhalb des Gesamtanalysezeitraums (Jan 95 - Dez 96) hauptsächlich im Bereich von 150 MW bis 450 MW. Leistungen ober- und unterhalb des genannten Bereichs kommen eher selten vor. Trotzdem sollte nicht unbedingt von dem angegebenen Mittelwert (297,7 MW) als Bezugsmaß für alle Prognosen ausgegangen werden, denn dafür sind die Abweichungen von diesem Mittelwert (Standardwabweichung = 88,16 MW) zu stark und noch zu häufig.
Um festzustellen, wie stark die Leistungsverteilung innerhalb der Woche variiert, stellen Abbildung 2.2 und Abbildung 2.3 genau den gleichen Sachverhalt dar, wie Abbildung 2.1, diesmal jedoch separat alle Wochentage ohne Feiertage, bzw. alle Wochenenden und Feiertage.
Seite 21
Diplomarbeit
Abbildung 2.2: Histogramm zur Netto-Erzeugerleistung an Wochentagen ohne Feiertage
Abbildung 2.3: Histogramm zur Netto-Erzeugerleistung an Wochenenden und Feiertagen
Es zeigt sich also, daß sich die Wochentage hinsichtlich ihrer Leistungscharakteristik sehr wohl von den Wochenenden und Feiertagen unterscheiden, so daß bei der Prognose in dieser Beziehung auf jeden Fall unterschieden werden sollte.
Seite 22
Arbeit zitieren:
Manfred Damsch, 1997, Erstellung eines Prognosesystems für die elektrische Lastganglinie des 50Hz-Netzes der Stadtwerke Bremen AG, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Das aktuelle Gesundheitssystem Russlands im Hinblick auf die Transform...
Sozialpädagogik / Sozialarbeit
Hausarbeit, 12 Seiten
Krankenversicherung in der Russischen Föderation
VWL - Fallstudien, Länderstudien
Diplomarbeit, 72 Seiten
Mehrwertsteuer-Reformmodelle für die EU
BWL - Rechnungswesen, Bilanzierung, Steuern
Seminararbeit, 27 Seiten
Manfred Damsch's Text Erstellung eines Prognosesystems für die elektrische Lastganglinie des 50Hz-Netzes der Stadtwerke Bremen AG ist nun auf dem Buchmarkt erhältlich
Manfred Damsch hat den Text Erstellung eines Prognosesystems für die elektrische Lastganglinie des 50Hz-Netzes der Stadtwerke Bremen AG veröffentlicht
Manfred Damsch hat einen neuen Text hochgeladen
0 Kommentare