Região do Norte.
Editado a 31 de Março: Os números publicados no dia 30 estavam engatados. Contaram muitos casos em duplicado quando integraram dados das autarquias com os do sistema de vigilância epidemiológica (2). Por isso, vou ignorar os dados de dia 30 e acrescentar algumas correcções ao post, em itálico
A Câmara do Porto «deixa de reconhecer autoridade à senhora directora-geral da Saúde» se declarar medidas mais extremas para conter a propagação do SARS-CoV-2. Politiquices à parte, eu queria ver se havia alguma razão para preocupação com o aumento de casos confirmados de COVID-19 na Região do Norte. Um problema de olhar para os dados em mais detalhe, em vez de considerar o agregado, é que aumenta o peso relativo de factores estranhos ao que procuramos. Por exemplo, entre os dias 26 e 27 de Março não houve novos casos confirmados na região de Lisboa. Isto não foi por folga do vírus. Entre o vírus e os dados de que dispomos interpõem-se sempre atrasos nos testes, problemas nos registos e outros factores alheios à epidemia. Nos valores agregados estes desvios pontuais tendem a cancelar-se e o total de casos confirmados em Portugal varia de dia para dia de forma bastante estável. Mas visto de perto o ruído é maior. Os gráficos abaixo mostram a proporção de casos novos e casos acumulados somando por região NUTS-II os dados dos concelhos.
Substituí o gráfico original por este, que omite o dia 30.
No gráfico da esquerda nota-se bem a grande variação diária. É um exemplo visual do perigo de fazer análises com grão mais fino que o do ruído. Mas o gráfico da direita, com os valores acumulados, é mais estável. Pode-se ver que, realmente, a Região do Norte tem um peso maior no total de casos confirmados mas, por outro lado, a proporção de casos no Norte não parece estar a aumentar muito. Talvez um pouco mas com oscilações tão grandes de dia para dia não é claro se é por tendência se é por acaso. Ainda assim, parece que nos três últimos dias o Norte tem sido responsável por uma fracção crescente dos casos novos.
Uma forma de tentar perceber porquê seria olhar em detalhe para os dados dos concelhos e procurar padrões que sugerissem uma explicação. Este método de data mining tem uma longa tradição, desde o tempo em que se fazia com folhas de chá ou entranhas de animais. O problema disto, além do ruído, é que o número de padrões possíveis explode combinatoriamente com a quantidade de factores considerados, praticamente garantindo à partida que vamos encontrar explicações para todos os gostos. O mais prudente é fazer o contrário: formular hipóteses que se possa testar com os dados e depois procurar especificamente o que nos permita testar essas hipóteses. O que vier a mais pode ser admitido como hipótese a testar com novos dados mas não mais do que isso.
Assim, decidi considerar três possibilidades. A primeira é a de que na região Norte a taxa de crescimento está maior por toda a região. A segunda é a de que o crescimento se deve mais à contribuição de muitos concelhos pequenos. E a terceira é que o problema principal está no concelho do Porto. Só esta última é que daria razão à directora-geral da Saúde. Para ver isto, represento abaixo a proporção de casos novos em cada dia distribuídos pelos vários concelhos. Cada concelho está marcado no eixo das abcissas em função do (logaritmo) do número total de casos. O Porto é o ponto mais à direita. As linhas mostram a distribuição de casos novos em cada dia.
Conclusão original, baseada nos dados errados: Até ontem, o Porto estava a contribuir uma fracção modesta, com o grosso dos casos provindo, em agregado, de concelhos no meio da distribuição. Mas hoje o cenário mudou radicalmente, com o Porto açambarcando a maior parte da área debaixo da curva. A menos que isto se deva a algum problema contabilístico (ou erro da minha parte), penso que a directora-geral da Saúde tem razão.
Na verdade, não se nota nada de particularmente grave no Porto. É o concelho com mais casos no total na Região do Norte mas o problema parece ser generalizado, com o grosso dos casos desta região contribuídos agora pelo agregado da vários concelhos. Não se justifica por isso tentar isolar um concelho em particular.
Como da minha opinião não dependem milhares de vidas, posso encarar esta conclusão como provisória e aguardar uns dias até ter mais dados para reavaliar estas hipóteses. Na DGS não têm esse luxo. Não lhes invejo a responsabilidade de decidir já o que fazer, ou não fazer, sabendo que qualquer opção poderá ter consequências trágicas.
Principalmente porque não é trivial recolher estes dados em tempo real, com muito pouca possibilidade de controlar os números atempadamente e dependendo de pessoas que estão, ao mesmo tempo, a resolver problemas sérios com os doentes.
Actualizei novamente o código e os dados na pasta pasta partilhada, já com as alterações com que corrigi o post.
1- Público, Câmara do Porto critica cerco sanitário ao Porto. E questiona “autoridade” da directora-geral da Saúde
2- JN, Cerco sanitário no Porto "não faz qualquer sentido", diz secretário de Estado