Comparative Analysis of Linear Regression and Machine Learning Models for Dead Fuel Moisture Content Prediction in Golestan Province Forests in northeast Iran
Keywords: Environmental variables, fine fuel, deadwood, Regression model, SVM, RF, CNN, Wildfire risk Schlüsselbegriffe: Umweltvariablen, Brennmaterial, Totholz, Regressionsmodell, SVM, RF, CNN, FMC, Waldbrandrisiko Accurate prediction of dead fuel moisture content (FMC) is critical for wildfire management, particularly in the Hyrcanian forests of Iran. This study evaluates the performance of machine learning models—Random Forest (RF), Support Vector Machine (SVM), Gradient Boosting (GBoost), and Convolutional Neural Network (CNN) versus traditional linear regression methods in predicting FMC for three fuel classes (1-hr, 10-hr, and litter) over Golestan province, NE Iran. Using data collected from 235 plots between March and November 2023, we incorporated meteorological variables including temperature (T), relative humidity (RH), and wind speed (WS), along with topographic features, into the models. The results showed that multivariable models considerably outperformed the univariate models, and machine learning models were more accurate than the linear regression models. The most accurate model was RF reaching an adjusted coefficient of determination (R2adj) of 97.08 and a relative RMSE of 5.93%, considering the training data. Meanwhile, with the test data, RF obtained an R2adj of 87.99, with a relative RMSE of 10.44%. Furthermore, the performance of the SVMs is very good, with an R2adj of 85.40 for the training data and 86.86 for the test data. In contrast, the linear regression models had lower accuracy, with the best performance, from univariate models being RH with a R2adj of 66.70 and a relative RMSE of 18.90%. Multivariable regression models combining RH, T and vapor pressure deficit (VPD) improved their performance, but still fell short of machine learning models. The results show that RH and VPD were the most important variables for FMC prediction, especially for fine fuels. The machine learning models showed excellent performance due to their capabilities for describing nonlinear relationships and performing well with high-dimensional data enhancing FMC predictions by up to 31% over traditional methods. This study advances the understanding of FMC dynamics by demonstrating the enhanced accuracy of machine learning models in FMC prediction, here studied for complex temperate forest ecosystems. By highlighting the importance of RH and VPD as critical predictors, the findings contribute to the growing body of knowledge on wildfire risk assessment. Still these results underscore the need for further research to refine models and explore their applicability in diverse environments and under varying climatic conditions. Die genaue Vorhersage des Feuchtigkeitsgehalts totem Brennmaterial (Fuel Moisture Content, FMC) ist entscheidend für das Wildfeuermanagement, insbesondere in den Hyrkanischen Wäldern Irans. Diese Studie bewertet die Leistung von maschinellen Lernmodellen – Random Forest (RF), Support Vector Machine (SVM), Gradient Boosting (GBoost) und Convolutional Neural Network (CNN) – im Vergleich zu traditionellen linearen Regressionsmethoden bei der Vorhersage des FMC für drei Brennmaterialklassen (1-Stunde, 10-Stunde und Streu) in der Provinz Golestan, Nordost-Iran. Die Daten wurden zwischen März und November 2023 auf 235 Probeflächen erhoben und umfassten meteorologische Variablen wie Temperatur, relative Luftfeuchtigkeit (RH) und Windgeschwindigkeit sowie topografische Merkmale. Die Ergebnisse zeigten, dass multivariable Modelle die univariaten Modelle deutlich übertreffen hinsichtlich Genauigkeit und maschinelle Lernmodelle genauer sind als lineare Regressionsmodelle. Das RF-Modell erreichte die höchste Genauigkeit mit einem adjustierten Bestimmtheitsmaß (R2adj) von 97,08 und einem relativen RMSE von 5,93 % für die Trainingsdaten. Für die Testdaten erzielte RF ein adjustiertes R² von 87,99 und einen relativen RMSE von 10,44 %. Auch SVM zeigte eine sehr gute Leistung mit einem adjustierten R2adj von 85,40 für die Trainingsdaten und 86,86 für die Testdaten. Im Gegensatz dazu wiesen lineare Regressionsmodelle eine deutlich geringere Genauigkeit auf. Das beste univariate Modell, basierend auf RH, erreichte ein adjustiertes R2adj von 66,70 und einen relativen RMSE von 18,90 %. Multivariable Regressionsmodelle, die RH, Temperatur und VPD kombinierten, verbesserten die Leistung, blieben jedoch hinter den maschinellen Lernmodellen zurück. Die Ergebnisse verdeutlichen, dass RH und VPD die wichtigsten Variablen für die FMC-Vorhersage sind, insbesondere für feines Brennmaterial. Die ausgezeichnete Leistung der maschinellen Lernmodelle ist auf ihre Fähigkeit zurückzuführen, nichtlineare Zusammenhänge zu erfassen und mit hochdimensionalen Daten effektiv umzugehen. Diese Modelle verbesserten die Vorhersagegenauigkeit des FMC um bis zu 31 % im Vergleich zu traditionellen Methoden. Diese Studie erweitert das Verständnis der Dynamik von FMC in Brennmaterial, indem sie die verbesserte Genauigkeit maschineller Lernmodelle bei der FMC-Vorhersage aufzeigt, insbesondere in komplexen gemäßigten Waldökosystemen. Durch die Hervorhebung der Bedeutung von RH und VPD als kritische Prädiktoren tragen die Ergebnisse zur wachsenden Wissensbasis für die Bewertung von Waldbrandrisiken bei. Dennoch unterstreichen diese Ergebnisse die Notwendigkeit weiterer Forschung, um die Modelle zu verfeinern und ihre Anwendbarkeit in unterschiedlichen Umgebungen und unter verschiedenen klimatischen Bedingungen zu untersuchen.