Zum Inhalt springen

Wettervorhersage mit KI: Das nächste große Ding?

Wer kennt’s nicht? Die Wetter-App präsentiert am Montag für den kommenden Donnerstag manchmal ganz andere Wetterprognosen als zwei Tage später am Mittwoch. Wie schwer kann es eigentlich sein, die Temperaturen präzise vorherzusagen? Kann es ein Machine-Learning-Modell vielleicht sogar besser als die numerischen Simulationen von Meteorolog:innen? Diese Frage wird derzeit in der Forschung heiß diskutiert. Voraussetzung für die Anwendung von Machine Learning auf dem Niveau von modernen Wetterprognosen sind allerdings riesige Datensätze, welche ein umfassendes Bild des atmosphärischen Zustands der Erde über viele Jahre beinhalten müssen.

Wie genau kann eine Prognose basierend auf einem Klimadatensatz sein, welcher nur Daten einer einzigen Wetterstation enthält?

Bereinigte Datensätze mit linearer Interpolation

Wir haben es ausprobiert und anhand von Zeitreihen eine Wettervorhersage für Bad Tölz erstellt. Warum genau Bad Tölz? Weil’s da einfach richtig schön ist. Zeitreihen sind Daten, deren Werte an den Zeitpunkt ihrer Messung geknüpft werden. Das sind in unserem Fall also vergangene Temperaturdaten aus Bad Tölz. Je lückenloser desto besser. Sollten stellenweise Daten fehlen, können diese mithilfe von linearer Interpolation geschätzt werden. So lassen sich kleinere Lücken füllen und komplette Datensätze herstellen.

Um ein möglichst präzises Modell zu generieren, haben wir neben der Temperatur weitere Daten einbezogen, beispielsweise zum Luftdruck, zum Niederschlag oder zur Luftfeuchtigkeit. Außerdem wissen wir, dass die Temperaturschwankungen tagsüber sowie im Jahresverlauf relativ gleichmäßig sind. Dieses Wissen haben wir in unsere Schätzungen mit einbezogen.

Temperaturprognose für Bad Tölz mit Zeitreihenanalyse

Nicht immer muss man das Rad neu erfinden. Modelle zur Prognose von Zeitreihen gibt es bereits. Wir verwenden ein Modell namens LightGBM. Dieses basiert auf Entscheidungsbäumen – ein Ansatz aus dem Bereich des Maschinellen Lernens. LightGBM ist einer der populärsten Vertreter der Gradient Boosting Trees. Gradient Boosting Trees sind eine Klasse von Verfahren, welche derzeit als State of the Art für tabellarische Daten gehandelt werden. Dahinter steckt ein klassischer Machine-Learning-Algorithmus, welcher Regelmäßigkeiten in den Zeitreihen erkennt und daraus Temperaturwerte für die Zukunft berechnet.

Fehleranalyse zu unserer Temperaturprognose

Was haben wir genau gemacht? Wir haben für den 28.9.2022 eine Wetterprognose für Bad Tölz erstellt – in drei Stundenintervallen. Berechnet haben wir die Prognose am 27.09.2022 und von dort aus insgesamt 2,5 Tage im Voraus betrachtet. Natürlich wollten wir wissen, ob unsere Werte ins Schwarze getroffen haben. Deswegen haben wir sie mit der offiziellen Wettervorhersage verglichen. Das Ergebnis kann sich sehen lassen (siehe Grafik).

Die von uns errechneten Wert wichen um 15:00 Uhr am stärksten von der realen Temperatur ab – um 1,9 Grad Celsius. Der Deutsche Wetterdienst betrachtet kurzfristige Punktprognosen mit einer Abweichung von weniger als 2,5 Grad Celsius als Treffer. Deswegen werten auch wir unsere Prognose als Erfolg.

Wir haben mit diesem Fall natürlich keinen empirischen Beweis dafür geliefert, dass Machine Learning für Wetterprognosen geeignet ist. Hierfür reichen Datenlage und Methodik schlichtweg nicht aus. Machine-Learning-Ansätze tun sich beispielsweise schwer damit, Wetterumschwünge und Ausnahmeereignisse vorherzusagen. Es ist aber interessant zu sehen, das kurzfristige Prognosen durchaus funktionieren können.

Was KI künftig vorhersagen kann

Es gibt neben der Wettervorhersage viele andere sinnvolle Anwendungsbereiche. Beispielsweise können Auswertungen von Zeitreihen helfen, relevante Business-Entscheidungen zu treffen: Wo sind Windparks am effizientesten? Welche Gebiete eignen sich für großflächige Solaranlagen? Wie groß wird der Umsatz eines Produktes an einem bestimmten Tag sein und viele weitere.

Für unterschiedliche Anwendungsfälle performen unterschiedliche Prognosemodelle am besten. Eine One-size-fits-all-Lösung existiert nicht. So hat Facebook beispielsweise das Modell Prophet speziell zur Beschreibung von Geschäftsprognosen entwickelt.

Und ob Machine- oder Deep-Learning Ansätze bei komplexen Wettervorhersagen die richtige Wahl sind, bleibt noch offen. In ein paar Jahren könnten sie die komplexen numerischen Simulationen verdrängt haben. Mit dem Vorteil, dass Prognosen deutlich weniger rechenaufwändig wären. Meteorolog:innen können aber aufatmen. Sie werden - auch für die Entwicklung und Anwendung solcher Modelle - noch gebraucht werden.

More predictions