A validação aqui apresentada foi feita para o ano de 2005 com os dados disponíveis de poluentes e com as previsões hindcast (previsões históricas que não sofreram alterações após o dia da previsão) das variáveis meteorológicas do ECMWF. Desta forma apresenta-se aqui os resultados de uma validação de previsões semi-hindcast pois, os dados de poluentes utilizados diariamente tem por vezes falhas na hora a que a previsão é feita, que são mais tarde completadas.
Apresentamos para cada modelo em cada estação, o erro médio normalizando, o viés e o erro médio absoluto associado. Para o índice apresentamos a respectiva tabela de contingência, a probabilidade de detecção de episódios de elevada poluição e a taxa de falso alarme associada a estes episódios.
Para melhor compreender os termos utilizados apresentamos em baixo a respectiva explicação:
Acerto ou percentagem de previsões correctas- Número total de previsões correctas sobre o total de dias previstos.
Erro absoluto médio – Indica a incerteza ou o erro médio associado a cada previsão. É dado pela soma do módulo das diferenças entre os valores previstos e observados sobre o total de dias previstos (N).
Erro normalizado (%) – Percentagem de erro associado no total das previsões realizadas
Probabilidade de detecção (POD) – Habilidade em prever o nível correspondente a elevada poluição que realmente aconteceu. Exemplo: POD de nível 2 de PM10 = 66 % indica que dois terços das previsões de nível 2 (fraco) de PM10 (acima de 50 um/m3) estavam correctas. É dado pela razão entre o número de dias em que a previsão acertou em determinado índice e o número total de dias observados com esse índice.
Tabela de contingência – Tabela que confronta cada nível de índice previsto com o observado
Taxa de falso alarme (TFA) – Indica o número de previsões de determinado nível do índice que falharam. É dado pela razão entre o número de dias previstos com determinado índice não igual ao índice observado e o número total de dias previstos com esse determinado índice.
Viés – Indica, em média, se as previsões do índice estão a ser subestimadas ou sobre estimadas. É dado pela soma das diferenças entre os valores previstos e observados. Valores negativos indicam subestimação do índice e positivos sobre estimação:
Nota: apresentamos os resultados apenas para os dias em que existem dados disponíveis para correr os modelos. Ou seja, os modelos correm com valores observados de Ozono, PM10, CO e NO2 do dia anterior. Para os dias em que não existam um mínimo necessário de dados do dia anterior, a previsão não é calculada. Como no caso extremo de dia 5 de Agosto de 2005 onde há uma grande falha de dados de CO e NO2 do dia anterior.