Bayesian Probabilistic Modeling applied to some environmental data using PyMC

Autores

  • Fernando Schimidt Instituto Federal de Goiás (IFG)/Câmpus Goiânia
  • Cleveland Lemos Freire Instituto Federal de Goiás (IFG)
  • Luiza Cintra Campos University College London
  • Mariângela Fontes Santiago Universidade Federal de Goiás (UFG

DOI:

https://doi.org/10.56762/tecnia.v9i2.840

Palavras-chave:

air pollution modeling, Bayesian modeling, dissolved oxygen, PyMC, water quality modeling, Python

Resumo

Modelos de aprendizado de máquina podem ser usados para prever problemas ambientais e até mesmo gerenciar sistemas e processos. O modelo probabilístico multivariado bayesiano (BMP) permite a construção de um modelo de previsão da concentração de Oxigênio Dissolvido (OD) na água. Com a utilização de softwares gratuitos que, a partir de dados históricos de análises de água, fornecem de forma rápida e robusta, resultados semelhantes aos produzidos por redes neurais artificiais. Neste trabalho, um modelo BMP desenvolvido em Python utilizando a biblioteca PyMC3 foi aplicado a dois conjuntos de dados ambientais não lineares diferentes. No primeiro, a calibração multivariada do OD foi realizada em água bruta do Rio Piracicaba (São Paulo - Brasil), onde o modelo BMP obteve um Erro Quadrático Medio de previsão (RMSEp) de 0,835 mg L-1 para 20 amostras testadas. No segundo conjunto, o mesmo processo de modelagem foi realizado para o Rio Paraíba do Sul (São Paulo - Brasil), obtendo um RMSEp de 0,839 mg L-1 para 20 amostras testadas. Ambos os resultados foram equivalentes aos obtidos com uma rede neural de retropropagação. Outros dados ambientais não lineares foram testados com resultados muito bons. Um modelo BMP para concentração de benzeno no ar urbano, como monitoramento da poluição atmosférica, obteve um RMSEp de 0,584 ug m-3.

Referências

ANA (Agência Nacional de Águas). Hidroweb Mobile, [s. l.], 2023. Disponível em: https://www.snirh.gov.br/hidroweb-mobile/mapa. Acesso em: nov. 2023.

ANACONDA. Anaconda Distribution, [s. l.], 2023. Disponível em: https://www.anaconda.com/download. Acesso em: nov. 2023.

ANTANASIJEVIĆ, D.; POCAJT, V.; POVRENOVIĆ, D.; PERIĆ-GRUJIĆ, A.; RISTIĆ, M. Modelling of dissolved oxygen content using artificial neural networks: Danube River, North Serbia, case study. Environmental Science and Pollution Research, [s. l.], v. 20, p. 9006-9013, 2013. DOI: https://doi.org/10.1007/s11356-013-1876-6.

BAIRD, C.; CANN, M. Química Ambiental. 4. ed. Porto Alegre: Bookman, 2011.

CETESB (Companhia Ambiental do Estado de São Paulo). InfoÁguas, São Paulo, 2023. Disponível em: https://cetesb.sp.gov.br/infoaguas/. Acesso em: nov. 2023.

CHEN, W. B.; LIU, W. C. Artificial neural network modeling of dissolved oxygen in reservoir. Environmental Monitoring and Assessment, [s. l.], v. 186, n. 2, p. 1203-1217, 2014. DOI: https://doi.org/10.1007/s10661-013-3450-6.

CONAMA (Conselho Nacional do Meio Ambiente). Resolução CONAMA nº 357, de 17 de março de 2005. Brasília, DF: Ministério do Meio Ambiente, 2012. Disponível em: http://conama.mma.gov.br/images/conteudo/LivroConama.pdf. Acesso em: 27 nov. 2023.

DAVIDSON-PILON, C. Bayesian Methods for Hackers: Probabilistic Programming and Bayesian Inference. Crawfordsville: Addison-Wesley, 2016.

DE VITO, S.; MASSERA, E.; PIGA, M.; MARTINOTTO, L.; DI FRANCIA, G. CO, NO2 and NOx urban pollution monitoring with on-field calibrated electronic nose by automatic Bayesian regularization. Sensors and Actuators B: Chemical, [s. l.], v. 143, n. 1, p. 182-191, 2009. DOI: https://doi.org/10.1016/j.snb.2009.08.041.

DE VITO, S.; MASSERA, E.; PIGA, M.; MARTINOTTO, L.; DI FRANCIA, G. On field calibration of an electronic nose for benzene estimation in an urban pollution monitoring scenario. Sensors and Actuators B: Chemical, [s. l.], v. 129, n. 2, p. 750-757, 2008. DOI: https://doi.org/10.1016/j.snb.2007.09.060.

EMAMGHOLIZADEH, S.; KASHI, H.; MAROFPOOR, I.; ZALAGHI, E. Prediction of water quality parameters of Karoon River (Iran) by artificial intelligence-based models. International Journal of Environmental Science and Technology, [s. l.], v. 11, p. 645-656, 2014. DOI: https://doi.org/10.1007/s13762-013-0378-x.

GRAF, R. Distribution Properties of a Measurement Series of River Water Temperature at Different Time Resolution Levels (Based on the Example of the Lowland River Notec, Poland). Water, [s. l.], v. 10, p. 203-210, 2018. DOI: https://doi.org/10.3390/w10020203.

HEATON, J. Programming Neural Networks with Encog3 in C#. 2. ed. Chesterfield: Heaton Research Inc, 2011.

KENNARD-STONE Algorithm. Nirpy Research, [s. l.], 2022. Disponível em: https://nirpyresearch.com/kennard-stone-algorithm/. Acesso em: nov. 2023.

KHAN, U. T.; VALEO, C. Comparing A Bayesian and Fuzzy Number Approach to Uncertainty Quantification in Short-Term Dissolved Oxygen Prediction. Journal of Environmental Informatics, [s. l.], v. 30, n. 1, p. 1-16, 2017. DOI: https://doi.org/10.3808/jei.201700371.

KHANI, S.; RAJAEE, T. Modeling of Dissolved Oxygen Concentration and Its Hysteresis Behavior in Rivers Using Wavelet Transform‐Based Hybrid Models. Clean Soil Air Water, [s. l.], v. 45, n. 2, 2017. DOI: https://doi.org/10.1002/clen.201500395.

LYON, A. Why are Normal Distributions Normal?. The British Journal for the Philosophy of Science, [s. l.], v. 65, p. 621-649, 2014. DOI: https://doi.org/10.1093/bjps/axs046.

MANAHAM, S. E. Química Ambiental. 9. ed. Porto Alegre: Bookman, 2013.

MARTIN, O. Bayesian Analysis with Python. Birmingham: Packt Publishing, 2016.

MC ELREATH, R. Statistical Rethinking: A Bayesian Course with Examples in R and Stan. New York: Chapman and Hall/CRC, 2015. 483 p.

DOCUMENTAÇÃO. PyCaret Library, [s. l.], 2023. Disponível em: https://pycaret.gitbook.io/docs/get-started/tutorials. Acesso em: 27 nov. 2023.

QIAN, S. S.; RECKHOW, K. H.; ZHAI, J.; MCMAHON, G. Nonlinear regression modeling of nutrient loads in streams: A Bayesian approach. Water Resources Research, [s. l.], v. 41, 2005. DOI: https://doi.org/10.1029/2005WR003986.

ROSS, A. C.; STOCK, C. A. An assessment of the predictability of column minimum dissolved oxygen concentrations in Chesapeake Bay using a machine learning model. Estuarine, Coastal and Shelf Science, [s. l.], v. 221, p. 53-65, 2019. DOI: https://doi.org/10.1016/j.ecss.2019.03.007.

SALVATIER, J.; WIECKI, T. W.; FONNESBECK, C. Probabilistic programming in Python using PyMC3. PeerJ Computer Science, [s. l.], v. 2, e55, 2016. DOI: https://doi.org/10.7717/peerj-cs.55.

SILVA, S. R.; SCHIMIDT, F. Reduction of Artificial Neural Network Input Variables from Principal Component Analysis Data in Dissolved Oxygen Modeling. Química Nova, São Paulo, v. 39, p. 273-278, 2016. DOI: https://doi.org/10.5935/0100-4042.20160024.

VON SPERLING, M. River Water Quality Studies and Modeling. 2. ed. Belo Horizonte: Editora UFMG, 2014.

WOOLEY, J. C.; LIN, H. S. (eds.). Catalyzing Inquiry at the Interface of Computing and Biology. Washington (DC): National Academies Press (US), 2005.

Downloads

Publicado

28.03.2025

Como Citar

Schimidt, F., Lemos Freire, C., Cintra Campos, L., & Fontes Santiago, M. (2025). Bayesian Probabilistic Modeling applied to some environmental data using PyMC. Revista Tecnia, 9(2), 14. https://doi.org/10.56762/tecnia.v9i2.840

Edição

Seção

Ciências Exatas e da Terra