quarta-feira, janeiro 20, 2021

O que é uma treta.

Uma treta é mais que uma afirmação falsa. Um erro, uma conclusão precipitada ou uma crença injustificada não são, por si só, tretas. Mesmo uma mentira descarada pode não ser uma treta. O que caracteriza a treta é a argumentação manhosa com a qual se tenta racionalizar uma tese que se percebe não ter fundamento adequado. Mesmo quando não é para enganar terceiros, o recurso a estratagemas argumentativos para disfarçar o disparate implica desonestidade intelectual. É esta aldrabice que torna a treta muito mais interessante que a mera falsidade.

Em geral, a motivação para conceber uma treta é a necessidade de justificar uma afirmação. Sem isso não vale a pena dizer tretas. Por exemplo, um crente a quem baste a sua fé para acreditar num deus não inventa tretas. Diz que acredita e se alguém perguntar porquê encolhe os ombros. É só se quer dar ares de racionalidade que precisa da teologia. Argumentos ontológicos, o problema lógico do mal e essas coisas são um embrulho enfeitado para disfarçar o vazio da caixa. Assim, uma forma de topar a treta é notar que aquilo que faz uma pessoa crer no que defende não é o que tenta parecer que conduz a essa conclusão. Deve haver muito poucos cristãos que se tornaram crentes pela leitura de um argumento ontológico. Isso é uma racionalização a posteriori. Como é regra nas tretas, a teologia só serve para pintar o alvo à volta de onde a bala calhou.

No entanto, na prática pode ser difícil determinar se a motivação e a justificação estão desalinhadas. O astrólogo pode estar deliberadamente a aldrabar quando invoca a influência dos astros e o simbolismo das constelações para fundamentar prognósticos. Mas também pode ser ele próprio vítima da treta que lhe pregaram. Por isso é melhor examinar a consistência das justificações. Um argumento martelado até dar a conclusão desejada naquele caso específico tende a ficar demasiado torto para servir fora desse âmbito restrito. Por exemplo, o astrólogo argumenta que a direcção em que estava um planeta quando nascemos é importante por aquilo que o planeta e as constelações simbolizam. Mas isso faz esperar que a direcção do crucifixo na parede, da igreja mais próxima ou dos sinais de trânsito nas redondezas também sejam relevantes para traçar o horóscopo, porque todos esses têm valor simbólico. Por esta fragilidade dos argumentos manhosos a treta exige compartimentalização. O que se aplica a isto não se aplica àquilo. Isto pode ser fácil de perceber usando a mesma justificação noutras conclusões. Por exemplo, aplicando os mesmos argumentos de fé em religiões diferentes.

A atractividade da treta vem de imitar a forma como aprendemos quase tudo. O nosso forte é aprender comunicando, sem que cada um tenha de descobrir por si aquilo que os outros já sabem. Basta que nos digam o que é verdade e que o justifiquem de forma minimamente adequada para aquele propósito. Não queremos um doutoramento em matemática só para aprender a fazer uma conta. Mas esta atitude de poupar trabalho ficando pela justificação superficial desencoraja a análise crítica de inconsistências. A mesma pessoa pode defender que se criminalize o discurso racista porque este nega que alguns seres humanos são pessoas, que se legalize o aborto porque um feto humano não é pessoa e por isso não tem direito à vida, e que se proíba a eutanásia de cães vadios porque apesar de não serem pessoas têm o direito à vida. E pode defender isto sem nunca lhe ocorrer que as justificações se contradizem. Detectar tretas exige contrariar esta tendência de guardar ideias em gavetas separadas.

Além deste problema, o nosso cérebro está adaptado para tomar decisões rápidas. O que faz sentido. Se ponderarmos demoradamente todas as decisões que tomamos não conseguimos fazer nada. Mas a consequência disto é exigir alguma disciplina naquelas situações em que se justifica adiar a decisão e examinar alternativas. Por exemplo, se perguntarmos a várias pessoas se devemos ter um serviço público de veterinária para atender gratuitamente animais doentes ou feridos, muita gente vai logo responder. Uns que sim e outros que não. Perguntados porquê uns poderão dizer que os animais também têm direitos e outros que os recursos limitados devem ser gastos em humanos, reforçando a posição inicial e escavando cada vez mais a trincheira que dificulta perceber os prós e contras de cada opinião.

Outra peça importante neste processo de compartimentalização, entrincheiramento e racionalização é o conceito vago. “Energia” tem um significado rigoroso em física mas pode ser usado para significar qualquer coisa em muitas tretas. As vibrações também. O conceito de “saber” também pode ser tornado tão vago que simplesmente ter fé numa crendice passa a ser uma “forma de saber”. Na nova justiça social, “identidade” deixa de ser aquilo que caracteriza cada indivíduo como único e passa a ser a mera pertença a um grupo, como na identidade de género ou raça. “Comunidade” agrupa pessoas que têm muito pouco em comum, como lésbicas, gays e transgénero. Até o termo “igualdade”, que devia ser claro, é usado de forma confusa em expressões como “igualdade de género”. A ideia de género serve precisamente para distinguir entre grupos como masculino e feminino e se queremos igualdade nestes grupos temos de especificar em quê. Essa omissão torna difícil interpretar mensagens como, por exemplo, a da organização UN Women denunciando que 19% de jornalistas assassinados em 2017 eram mulheres (1). Exigir clareza nos conceitos torna-nos pouco populares e aumenta a probabilidade de sermos bloqueados no Facebook mas é fundamental para nos protegermos de tretas.

Amanhã às 21:30 vou participar nos diálogos COGITO (2) e deixo este texto como mote para a conversa. Talvez motive alguns leitores a participarem com críticas. Mesmo que não tenham paciência para me ouvir, visitem a página porque há lá conversas interessantes. Parabéns aos organizadores por esta iniciativa e muito obrigado pelo amável convite.

1- UN Women, 3 de Maio 2018
2- COGITO, Diálogos

domingo, junho 21, 2020

Presencial.

O ensino presencial é melhor que o ensino remoto. As crianças precisam de socializar. A avaliação presencial é mais rigorosa. A escola é importante para mitigar desigualdades sociais. Há crianças que não têm condições adequadas para acompanhar a matéria se o ensino for remoto. Há muitas razões óbvias para ter escolas e universidades abertas e para ter aulas presenciais. E várias pessoas têm invocado essas razões para reabrir tudo. Manuel Heitor até afirmou que o ensino superior em Setembro «Vai ser de certeza presencial, disso temos a certeza»(1). Se bem que depois acrescentou que é certeza «salvo algum imprevisto». Um imprevisto como uma doença pulmonar se propagar mais no Outono do que no Verão, por exemplo. Isso será uma enorme surpresa se acontecer.

Um problema desta posição é que considera apenas um prato da balança. Os prós são óbvios, e é por isso que em condições normais temos escolas e universidades a funcionar com ensino presencial. Mas falta ponderar quanto estamos dispostos a pagar por isso. Quantos óbitos vale a diferença entre o ensino presencial e o ensino remoto? Dez? Cem? Mil? E não é só o número de mortos. Nós mal conhecemos este vírus e não fazemos ideia dos problemas que traz a longo prazo. A amostra que temos também está enviesada, como agora se está a descobrir. Quando o vírus se começou a espalhar tomámos medidas agressivas para o conter. Fechar escolas, trabalho remoto, ficar em casa. Isso protegeu muitos jovens. Quem sofreu foram os idosos nos lares, que precisam de cuidados e não puderam ficar isolados. Nas últimas semanas o comportamento dos jovens tem dado uma amostra menos enviesada e, neste momento, um terço dos internados em Santa Maria tem menos de 35 anos (2). A premissa de que isto só afecta os velhos deve ser reconsiderada antes de reabrir escolas. Manuel Heitor diz que «que o regresso “tem de ser feito com responsabilidade». No mínimo, exige-se a responsabilidade de considerar as consequências antes de ter a certeza de que escolhemos a melhor opção.

Outro problema é prático. Até haver vacina é preciso controlar a propagação do vírus. Por isso, qualquer pessoa que tenha estado em contacto com uma pessoa doente com COVID-19 tem de ficar de quarentena, sob vigilância. Não pode sair de casa e deve ficar isolado dos outros membros do agregado familiar(3) durante 14 dias(4). Isto quer dizer que sempre que se confirmar COVID-19 num aluno, colegas e docentes com quem esteve numa sala deverão ficar duas semanas isolados. Se se mantiverem as centenas de casos novos por dia, haverá interrupções constantes nas aulas. E exigir isto de alunos, docentes e familiares não é razoável. Isolar uma pessoa em casa durante duas semanas já é difícil se for um adulto mas é praticamente impossível se for uma criança. Ter de o fazer sempre que apareça um colega de turma com COVID-19 não é viável. Ou se vai ignorar as medidas de saúde pública ou não é possível ter aulas presenciais sem reduzir drasticamente o aumento diário de infectados.

Além disso, por cada aluno que se identifique com COVID-19 poderá haver meia dúzia que estão doentes e ninguém sabe. Os óbitos por COVID-19 em Portugal são cerca de 4% dos casos confirmados mas a estimativa da letalidade por infecção é de 0.5% a 1% (5), o que sugere que estamos a detectar entre um quinto a um décimo dos infectados, aproximadamente. Portanto, a exposição a pessoas infectadas será bastante maior do que aquela que pudermos medir. E se bem que as medidas de protecção ajudem, é uma questão de tempo até haver contágio. Se há surtos num hospital como o IPO, vai certamente haver nas escolas. As estimativas para a probabilidade de contágio são de 17% sem máscara e 3% com máscara (6). Claramente, vale a pena usar máscara, porque reduz bastante o contágio. Mas com 3% de probabilidade de transmissão, se houver uma pessoa infectada numa sala com 15 pessoas a probabilidade de infectar pelo menos uma outra pessoa quase chega aos 40%. Por aula. Um factor a ter em conta antes de abrir as escolas é que as aulas presenciais dão as condições ideais para transmitir o vírus: várias pessoas a conversar numa sala durante uma hora ou mais, e repetidas vezes, vários dias, ao longo de semanas. Pior que isto só se for prática diária de coro.

Quando começar a chuva não vai ser possível ter as janelas abertas. No ar húmido as gotículas que transportam o vírus vão durar mais tempo. Muitas pessoas vão apanhar gripes e vão tossir e espirrar mesmo antes de terem sintomas de COVID-19. Juntar pessoas em recintos fechados é bom para propagar o vírus, falar é bom para propagar o vírus, e se bem que as máscaras ajudem não fazem milagres. E sempre que se descobrir alguém infectado é preciso isolar todos os seus contactos. Parece-me que o “imprevisto” com que o ministro ressalvou a sua certeza é mais que previsível. Não vai poder haver aulas presenciais em Setembro. As aulas presenciais são muito importantes mas não há condições de segurança para poder ensinar assim.

Já agora, em jeito de post scriptum, há também o argumento de que o objectivo era aplanar a curva, conseguimos, agora vamos voltar ao normal. É um equívoco. Aplanar a curva era condição necessária para termos opções. Se não tivéssemos aplanado a curva agora estávamos a acumular mortes a um ritmo terrível, o SNS tinha colapsado e ninguém ia sequer querer sair de casa. Aplanar a curva permite-nos agora escolher o que vamos fazer, se controlar mais ou menos a doença. Mas não nos permite escolher quanto cada opção vai custar. E antes de se decidir abrir escolas (ou centros comerciais, ou campeonatos de futebol) é preciso estimar adequadamente o preço. A minha estimativa é de que será muito alto e preocupa-me que o ministro tenha tantas certezas sem ter estimativa nenhuma de quanto as aulas presenciais vão custar.

Editado a 29 de Junho para substituir “mortalidade” por “letalidade”. Obrigado ao leitor Datatrap pela correcção.

1- Público, Ensino Superior vai ser “de certeza presencial” a partir de Setembro
2- Expresso, Covid-19. Vaga de jovens infetados em esplanadas e praias chega ao internamento de Santa Maria
3- SNS, O que é a quarentena (“isolamento profilático”) e o isolamento?
4- SNS, Existe mais do que um tipo de contacto próximo?
5- Nature, How deadly is the coronavirus? Scientists are close to an answer
6- Livescience, Face masks may reduce COVID-19 spread by 85%, WHO-backed study suggests

terça-feira, maio 26, 2020

Diz que é uma espécie de gripe.

Tenho tido várias conversas (remotas) acerca da COVID-19 com um leque alargado de pessoas, desde médicos responsáveis por unidades de cuidados intensivos até desconhecidos no Facebook a alegar que, como a esperança média de vida é 80 anos, não faz mal alguém morrer de COVID-19 aos 81 porque se não fosse disso seria de outra coisa (1). Uma correlação que me saltou à vista é que quem menoriza a gravidade desta doença, dizendo que é como uma gripe, é quem está mais longe de lidar com os que morrem dela (2). E há várias razões para rejeitar essa hipótese de que a COVID-19 é só uma gripe fora de época.

O SARS-CoV 2 é um parente próximo do SARS-CoV, o vírus da SARS, ambos da linhagem B dos coronavirus humanos. As proteínas são praticamente idênticas, o perfil clínico é semelhante (3) e são muito diferentes dos coronavirus da linhagem A, que causam gripe, como o OC43 (4). Em particular, as proteínas membranares às quais os SARS-CoV e SARS-CoV 2 se ligam para entrar nas células humanas são diferentes daquelas às quais se ligam vírus da gripe como o OC43. Isto faz com que a doença seja diferente, à parte do ponto comum de infectarem os pulmões, com mais complicações no sistema nervoso (5), rins (6) e outros órgãos (7). Vai demorar até se saber quais são as consequências de ter COVID-19. E também nisto é muito diferente da gripe. A gripe é uma doença que conhecemos bem mas esta é uma doença nova que encontrámos há uns meses pela primeira vez.

Mas o argumento mais comum diz para ignorar diferenças no vírus e quadro clínico, alegando que a COVID-19 é como a gripe porque mata pouco. O que só se poderia concluir se a doença já fosse bem conhecida em vez de uma doença nova cujos efeitos a longo prazo ninguém conhece. No entanto, mesmo a curto prazo isto é falso. A letalidade por infecção da gripe sazonal é inferior a 0.1%. Mata menos de uma pessoa em cada mil infectados. Dos 712 doentes com COVID-19 no cruzeiro Diamond Princess, morreram 14 (8), o que dá 2%. Eram pessoas mais velhas do que a média mas os testes serológicos a 70 mil pessoas em Espanha mostram que só 5% foram infectados por este vírus (9). Com 47 milhões de habitantes e 27 mil mortos, isto dá uma letalidade por infecção de pouco mais de 1%. Se a letalidade fosse de 0.1% teria de haver 27 milhões de infectados em Espanha, 4.1 milhões na Suécia e 1.3 milhões em Portugal. Não é plausível que 1.3 milhões de portugueses tenham contraído esta doença, 13% da população, e só se tenha apanhado 31 mil casos positivos em quase 700 mil testes feitos a 300 mil suspeitos. Uma letalidade de 1%, ou perto disso, é muito mais plausível com os números que vemos em vários países.

Um país que demonstra claramente a diferença entre a gripe sazonal e a COVID-19 é o Brasil. Infelizmente. O Brasil é um país tropical e, por isso, é pouco afectado pela gripe. Em 2019, por exemplo, morreram mil e cem pessoas com as várias estirpes de gripe no Brasil (10). Neste momento morrem mil pessoas por dia com COVID-19, e só contando os números oficiais de casos confirmados. É que, além da letalidade por infecção ser dez vezes maior, também é um vírus mais contagioso. Em vez de infectar 15% da população, se a epidemia se descontrola infecta 70%. Assim, se mata dez vezes mais por infecção e infecta cinco vezes mais pessoas, o resultado é cinquenta vezes mais mortes do que com a gripe. O número pode não ser exactamente este. Depende certamente de muitos factores, desde a distribuição etária da população à qualidade do sistema de saúde. Mas é óbvio que a COVID-19 não é uma gripe.

O intrigante nisto é o número de pessoas que insiste no contrário. Algumas, como Bolsonaro, têm claros interesses em propagar a ideia de que isto é só uma gripe. Mas em muitos casos penso que é por a virtude epistémica de suspender uma opinião até se ter dados, e mudar de opinião em função desses dados, é vista por muitos como uma falha de carácter. O que se quer é pessoas inabalavelmente convictas, e de preferência convictas de que “eles” estão todos a planear isto para nos fazer mal. Vi muito disso numa breve passagem pelo grupo de Facebook #sairdecasa, que tem «o grande objectivo de ser contra os confinamentos» (11). Numa conversa com Rui Lima, um dos moderadores, mencionei os dados de Espanha que mostram que a COVID-19 tem uma mortalidade por infecção de 1% e não dez vezes menor como ele defendia. Lima disse que eu não podia fazer as contas assim e que tinha de considerar só Madrid: «Em Madrid a Seroprevalencia é 11,3%... A região tem quase 7.000.000 de habitantes, 8900 mortos à data de hoje». Quando apontei que isso dava 1% de letalidade à mesma e que 0.1% era impossível porque exigiria 8.9 milhões de infectados entre 7 milhões de habitantes, acusou-me de dizer «que os serológicos estão errados». Por achar esse argumento suspeito, de tão obviamente falso que era, acabei expulso do grupo (11).

Esta atitude de pôr a convicção à frente dos factos é muito comum. Na astrologia, homeopatia, religiões, entre caçadores de OVNI e fantasmas e essas coisas. Mas este caso é excepcional. Porque, neste caso, esta teimosia irresponsável vai matar muita gente.

1- A esperança média de vida aos 80 anos é de 9.2 anos na Europa. É isso que perde quem morre de COVID-19 nessa idade, além do sofrimento óbvio de dias de asfixia a agravar-se até matar. Citando, «a esperança média de vida na europa ronda os 80 anos. A média de mortes por covid19 ronda os 81. Isto quer dizer que nunca poderemos recuperar pessoas que já estão em fim de vida. Parando ou não a economia as pessoas vão morrer. De Covid, de gripe sazonal ou de outra coisa qualquer. Podemos tentar adiar a idade de vida ao máximo mas nunca poderemos artificializar a vida.» Hélder Costa, num comentário no grupo público #sairdecasa
2- Por exemplo, André Dias, doutorado em modelação de doenças pulmonares: Autópsia de um Equivoco - SARS cov-19
3- Xu et. al, Systematic Comparison of Two Animal-to-Human Transmitted Human Coronaviruses: SARS-CoV-2 and SARS-CoV
4- Wikipedia, Human coronavirus OC43, e Betacoronavirus
5- Baig et. al., Evidence of the COVID-19 Virus Targeting the CNS: Tissue Distribution, Host–Virus Interaction, and Proposed Neurotropic Mechanisms
6- John’s Hopkins Medicine, Coronavirus: Kidney Damage Caused by COVID-19
7- CNN, Covid-19 infects intestines, kidneys and other organs, studies find
8- Wikipedia, Diamond Princess
9- El Pais, Antibody study shows just 5% of Spaniards have contracted the coronavirus
10- BBC Brasil, Coronavírus: média diária de mortes no Brasil já é 3 vezes a da gripe
11- Estão aqui neste post do Facebook os objectivos do grupo e uma conversa que resume bem a minha breve estadia: #sairdecasa

segunda-feira, abril 13, 2020

Mais modelos.

Em abstracto, um modelo matemático é um conjunto de operações sobre parâmetros ajustáveis. Conforme o que queremos fazer, seja separar exemplos em classes, estimar distribuições ou aproximar uma curva a um conjunto de pontos, mexemos nesses parâmetros até ficar como queremos. A popularidade da curva logística na modelação amadora da COVID-19, a tal curva que maltratei no post anterior (1), deve-se à facilidade com que aproxima qualquer coisa que pareça um “S”, seja o acumulado de infectados seja os casos novos por dia. No entanto, para o problema concreto de analisar os dados, o modelo não é uma mera abstracção matemática. É uma ferramenta que deve servir para ajudar a esclarecer o que se passa ou ajudar a prever o que ainda não sabemos. Há modelos que ajudam a prever mesmo sem se perceber o que fazem mas isso só funciona quando os dados aos quais se ajusta o modelo vêm da mesma distribuição daquilo que queremos prever. Com a COVID-19 em Portugal não dá para fazer isso porque não temos um lote de Portugais onde treinar e validar os modelos que depois serviriam para fazer previsões acerca deste Portugal em que vivemos. Portanto a abordagem tem de ser a outra. Precisamos de modelos cujos parâmetros correspondam a algum aspecto da realidade, que nos ajudem a perceber o que se passa e, se os parâmetros estiverem correctos, permitam prever o que pode acontecer a seguir. É isso que os epidemiologistas tentam fazer.

Eu não sou epidemiologista mas, aproveitando que se sabe poucos dos parâmetros necessários para um modelo a sério, vou atalhar com um modelo simplificado. O meu é assim:



Dos susceptíveis, no início quase toda a gente, vão saindo todos os dias uma fracção proporcional aos contagiosos. Esta fracção aumenta os infectados, que mais tarde se tornam contagiosos. Os valores nas arestas do grafo são as fracções por dia. Os contagiosos podem tornar-se sintomáticos ou assintomáticos, podem mais tarde curar-se e deixar de contagiar, ou ir parar ao hospital e ter mais azar com a doença. Assumo que no hospital já não vão contagiar muita gente pelo que quem contagia, neste modelo, são os contagiosos, os assintomáticos e os sintomáticos. Estes últimos são quem tem sintomas suficientes para ir ao hospital, ser declarado suspeito e eventualmente testado confirmando a doença. Por isso, é o total dos sintomáticos que comparo com o total de casos confirmados em Portugal para ajustar o modelo.

O parâmetro que ajusto é apenas o primeiro, a taxa de contágio*. Aquele valor de 0.522 resulta de ajustar a curva à fase inicial de crescimento exponencial. Depois, a partir do dia 31 da simulação (é o dia que optimiza o ajuste aos dados da DGS), o valor é reajustado para ter em conta as medidas de mitigação. Na curva que obtive fica a 0.031. Ou seja, cerca de 3% de probabilidade por dia, em média, de alguém com COVID-19 contagiar outra pessoa neste momento. Os restantes parâmetros são inventados com base no que parece ser o tempo de incubação e duração da doença, mas são muito questionáveis e, por isso, repeti o ajuste mil vezes variando aleatoriamente os outros parâmetros até ±30% do seu valor original. Estas são as curvas cujo ajuste foi pelo menos tão bom quanto o original:



Primeiro, as más notícias. É mais fácil prever o passado do que o futuro e se bem que todas as curvas se aproximem dos dados a dispersão das previsões é enorme, dependendo muito de parâmetros cujo valor desconhecemos. E uma percentagem significativa dispara para valores muito altos, com dois terços das simulações prevendo até 50 mil confirmados nos próximos 3 meses, mesmo mantendo as medidas de mitigação. Julgo que na DGS também sabem disto e é por isso que estão a apertar com medidas adicionais. Não estamos safos ainda. Mas também há boas notícias. Primeiro, parece que o tal pico já passou. Na verdade, ocorreu logo quando se impôs as medidas de mitigação, iniciando o decaimento da fracção de infectados e, por isso, de contagiosos. O problema é que esse decaimento pode ser ainda lento e demorar a reflectir-se nos casos que observamos, os sintomáticos, que só surgem mais tarde com o progredir da doença. Segundo, mesmo nas simulações mais pessimistas é óbvio que as medidas que se tem tomado tiveram um impacto grande na propagação da doença. Mais importante ainda, apesar da curva com os parâmetros que escolhi estar no limite optimista da distribuição das simulações, o meu modelo em si é pessimista. Eu estou a assumir que a população é homogénea e a aplicar a toda a população os parâmetros que ajustam a curva aos casos confirmados. Mas a população é heterogénea, algumas pessoas resistem melhor que outras, e os casos que temos até agora são tendencialmente de pessoas mais susceptíveis. Não consigo estimar essa heterogeneidade mas é um factor importante e é provável que a curva real seja mais favorável do que a minha.

Adianta de pouco ajustar modelos arbitrários aos dados que temos ou tentar descobrir “o pico” porque o que importa é o que vem a seguir e isso depende de muitos parâmetros desconhecidos. Mais importantes ainda do que os parâmetros biológicos da doença são os factores psicológicos e económicos das pessoas. O bicho não está morto. Mexe-se pouco porque lhe pusemos um pé em cima e levantar o pé agora seria um desastre. Para evitar esse desastre é preciso resolver com urgência os problemas de quem não tem meios para ficar em casa à espera da vacina. Se bem que geralmente os problemas dos pobres sejam os menos prioritários, desta vez tenho esperança que lhes dêem a devida importância porque, situação rara, desta vez a saúde e a vida dos ricos depende das condições em que vivem os pobres. É preciso agora que todos percebam o perigo que correm se não colaborarem.

* Ajusto também o número inicial de infectados para dar certo com os dados da DGS a partir do 10º dia da simulação

Actualizei o código na pasta partilhada. Mas aviso que cada vez tem mais tralha feita cada vez com menos tempo e com código cada vez mais confuso.

1- Inflexão

quinta-feira, abril 09, 2020

Inflexão.

Tenho implicado regularmente com quem usa a curva logística para prever quando a epidemia estará controlada. Em parte é feitio. Gosto de implicar. Mas, neste caso, tenho outras razões para isso.

Se pusermos um pouco de iogurte em leite morno, os bacilos começam a reproduzir-se. Cada um divide-se em dois, esses dois em quatro, oito, dezasseis, e assim por diante. A isto chama-se crescimento exponencial porque o número depende de uma constante elevada ao tempo e que, por isso, tem o tempo em expoente. Mas é mais fácil perceber a curva exponencial como sendo em cada instante proporcional ao que era no instante anterior. Seja a crescer seja a diminuir. Por exemplo, o pneu furado perde, a cada instante, uma fracção constante da pressão que tinha, num decaimento exponencial também.

Mas voltemos ao iogurte. Como o leite morno não é infinito, eventualmente os bacilos terão menos alimento e o seu crescimento irá abrandar até ficar tudo em iogurte. Assim, por causa desta limitação, o número de bacilos em função do tempo não dispara para o infinito mas faz uma curva em “S”, eventualmente estabilizando. A função logística é um bom modelo para estes casos em que o crescimento exponencial encrava no limite rígido da capacidade do sistema. É também isto que acontece quando um vírus se propaga tanto pela população que começa a ser difícil encontrar vítimas por infectar. Eventualmente há tanta gente doente ou imune que a infecção pára de crescer. Uma propriedade simpática da curva logística é que o ponto em que a taxa de crescimento deixa de aumentar e começa a diminuir (o famoso ponto de inflexão) corresponde a metade do valor máximo. Diz-nos logo onde a curva vai parar. Por isso muita gente procura o ponto de inflexão da COVID-19 para prever o patamar. Não é boa ideia.

O gráfico abaixo mostra o número de casos confirmados na Coreia do Sul contando a partir do dia em que houve pelo menos 100. Ajustando a curva logística aos dados até ao dia 15, até ao dia 16, e assim por diante até ao dia 20, o resultado é bastante consistente. Tendo passado o ponto de inflexão no dia 10, o abrandamento do crescimento a seguir sugere a tal curva em “S” que pára por volta dos oito mil casos. O problema é que não pára. E a razão para isto é que o “S”, neste caso, não tem nada que ver com o iogurte ou a infecção descontrolada. Com cinquenta milhões de habitantes, não é por ter oito mil infectados que o vírus fica com falta de espaço para crescer. O abrandamento deveu-se apenas à redução na taxa de novas infecções por causa das medidas tomadas e o crescimento a seguir depende do valor em que ficou essa taxa. E isso não dá para ver com a curva logística.



Para explorar isto corri umas simulações. Considero que uma pessoa infectada demora alguns dias até contagiar os outros, depois tem 50% de probabilidade de não ter sintomas, continuando a contagiar os outros até se curar. Se tiver sintomas acaba por ser testada*. São essas pessoas que notamos no número de confirmados. O gráfico abaixo mostra dois casos. Em ambos os casos, a infecção começa com 200 infectados, que uns dias depois se tornam contagiosos e começam a passar a doença a outra pessoa com 20% de probabilidade por dia. Isto dá o tal crescimento exponencial. Ao dia 40, nesta simulação, o governo toma medidas extraordinárias e a taxa de contágio cai abruptamente. Pode ver-se um efeito imediato no grupo das pessoas contagiosas. Mas isto só se vê na simulação. Na realidade, não sabemos o que se passa com essas pessoas porque só vemos o sub-conjunto que tem sintomas. Neste, o efeito surge gradualmente e aparenta chegar ao tal ponto de inflexão no dia 50, aproximadamente, quando a curva parece afastar-se da exponencial. Mas isto não é por ter chegado a meio caminho do máximo. Não é uma curva logística. É apenas o efeito da taxa de contágio ter diminuído por causa das medidas tomadas.



Isto também mostra como o resultado depende crucialmente da eficácia das medidas. O gráfico da direita mostra a simulação em que a probabilidade de contágio caiu para 1.2% por dia. Neste caso**, a propagação baixou o suficiente para a epidemia ficar controlada. Mas se as medidas tomadas baixarem a taxa de contágio dos 20% originais para 2.2% em vez de 1.2%, ficando aquém só um ponto percentual, a doença continua descontrolada. É por isso que me preocupa a travagem na queda da taxa de crescimento dos casos de COVID-19 em Portugal, que podemos ver no gráfico abaixo. Se chegarmos a 1 sabemos que o problema está controlado, pelo menos enquanto mantivermos as medidas de mitigação que temos agora em vigor. Mas até lá não adianta andar à procura do “ponto de inflexão” ou a fazer previsões de patamares com modelos logísticos. A curva logística é o modelo errado porque estamos muito longe de atingir o máximo de capacidade do vírus infectar a população. E o progresso futuro, mesmo mantendo as condições como estão agora, depende muito de diferenças demasiado pequenas para se detectar por enquanto olhando para os pontos.



* Na pasta partilhada incluí o código para estes gráficos e simulação. Estão lá os parâmetros para estas probabilidades para quem quiser ver, e simulo também os casos críticos, mortos e recuperados, mas esses detalhes não são importantes para este post. Está tudo aqui.
** A simulação é estocástica e não dá sempre exactamente os mesmos resultados. Mas corri várias vezes e, com estes valores, dá isto em geral.

segunda-feira, março 30, 2020

Região do Norte.

Editado a 31 de Março: Os números publicados no dia 30 estavam engatados. Contaram muitos casos em duplicado quando integraram dados das autarquias com os do sistema de vigilância epidemiológica (2). Por isso, vou ignorar os dados de dia 30 e acrescentar algumas correcções ao post, em itálico

A Câmara do Porto «deixa de reconhecer autoridade à senhora directora-geral da Saúde» se declarar medidas mais extremas para conter a propagação do SARS-CoV-2. Politiquices à parte, eu queria ver se havia alguma razão para preocupação com o aumento de casos confirmados de COVID-19 na Região do Norte. Um problema de olhar para os dados em mais detalhe, em vez de considerar o agregado, é que aumenta o peso relativo de factores estranhos ao que procuramos. Por exemplo, entre os dias 26 e 27 de Março não houve novos casos confirmados na região de Lisboa. Isto não foi por folga do vírus. Entre o vírus e os dados de que dispomos interpõem-se sempre atrasos nos testes, problemas nos registos e outros factores alheios à epidemia. Nos valores agregados estes desvios pontuais tendem a cancelar-se e o total de casos confirmados em Portugal varia de dia para dia de forma bastante estável. Mas visto de perto o ruído é maior. Os gráficos abaixo mostram a proporção de casos novos e casos acumulados somando por região NUTS-II os dados dos concelhos.

Substituí o gráfico original por este, que omite o dia 30.



No gráfico da esquerda nota-se bem a grande variação diária. É um exemplo visual do perigo de fazer análises com grão mais fino que o do ruído. Mas o gráfico da direita, com os valores acumulados, é mais estável. Pode-se ver que, realmente, a Região do Norte tem um peso maior no total de casos confirmados mas, por outro lado, a proporção de casos no Norte não parece estar a aumentar muito. Talvez um pouco mas com oscilações tão grandes de dia para dia não é claro se é por tendência se é por acaso. Ainda assim, parece que nos três últimos dias o Norte tem sido responsável por uma fracção crescente dos casos novos.

Uma forma de tentar perceber porquê seria olhar em detalhe para os dados dos concelhos e procurar padrões que sugerissem uma explicação. Este método de data mining tem uma longa tradição, desde o tempo em que se fazia com folhas de chá ou entranhas de animais. O problema disto, além do ruído, é que o número de padrões possíveis explode combinatoriamente com a quantidade de factores considerados, praticamente garantindo à partida que vamos encontrar explicações para todos os gostos. O mais prudente é fazer o contrário: formular hipóteses que se possa testar com os dados e depois procurar especificamente o que nos permita testar essas hipóteses. O que vier a mais pode ser admitido como hipótese a testar com novos dados mas não mais do que isso.

Assim, decidi considerar três possibilidades. A primeira é a de que na região Norte a taxa de crescimento está maior por toda a região. A segunda é a de que o crescimento se deve mais à contribuição de muitos concelhos pequenos. E a terceira é que o problema principal está no concelho do Porto. Só esta última é que daria razão à directora-geral da Saúde. Para ver isto, represento abaixo a proporção de casos novos em cada dia distribuídos pelos vários concelhos. Cada concelho está marcado no eixo das abcissas em função do (logaritmo) do número total de casos. O Porto é o ponto mais à direita. As linhas mostram a distribuição de casos novos em cada dia.

Conclusão original, baseada nos dados errados: Até ontem, o Porto estava a contribuir uma fracção modesta, com o grosso dos casos provindo, em agregado, de concelhos no meio da distribuição. Mas hoje o cenário mudou radicalmente, com o Porto açambarcando a maior parte da área debaixo da curva. A menos que isto se deva a algum problema contabilístico (ou erro da minha parte), penso que a directora-geral da Saúde tem razão.

Na verdade, não se nota nada de particularmente grave no Porto. É o concelho com mais casos no total na Região do Norte mas o problema parece ser generalizado, com o grosso dos casos desta região contribuídos agora pelo agregado da vários concelhos. Não se justifica por isso tentar isolar um concelho em particular.



Como da minha opinião não dependem milhares de vidas, posso encarar esta conclusão como provisória e aguardar uns dias até ter mais dados para reavaliar estas hipóteses. Na DGS não têm esse luxo. Não lhes invejo a responsabilidade de decidir já o que fazer, ou não fazer, sabendo que qualquer opção poderá ter consequências trágicas.

Principalmente porque não é trivial recolher estes dados em tempo real, com muito pouca possibilidade de controlar os números atempadamente e dependendo de pessoas que estão, ao mesmo tempo, a resolver problemas sérios com os doentes.

Actualizei novamente o código e os dados na pasta pasta partilhada, já com as alterações com que corrigi o post.

1- Público, Câmara do Porto critica cerco sanitário ao Porto. E questiona “autoridade” da directora-geral da Saúde
2- JN, Cerco sanitário no Porto "não faz qualquer sentido", diz secretário de Estado

sábado, março 28, 2020

Nós e os outros.

Este gráfico mostra a evolução da taxa de crescimento dos casos confirmados para este grupo de países, contando o dia 0 como sendo o dia em que o número de casos confirmados passou os 100. Para cada período de 5 dias, começando nos dias 0 a 4, calculo a taxa de crescimento exponencial. Com base nessa, calculo uma dispersão de valores para a taxa de crescimento por bootstrapping residual (1). A linha mais grossa representa a mediana desses valores e as linhas mais finas os percentis 10% e 90%.



Em todos estes países houve uma fase inicial em que as curvas se afastaram da exponencial, o que julgo ser por causa da transição conforme tomavam medidas de mitigação. Isto nota-se pela maior dispersão dos valores. A Suécia parece ser excepção, talvez por não ter tomado medidas excepcionais. Apesar disso, a taxa de propagação do vírus na Suécia diminuiu e parece ser relativamente baixa. Mas mais sobre isso adiante. O maior crescimento nesta fase inicial foi na China, o que não é estranho porque foi o primeiro país afectado. Os outros já sabiam o que por aí vinha. Portugal parece ter aplicado bem a lição. Manteve a taxa de crescimento comparativamente baixa no início e agora tem estado a diminuir. Mas por cá a procissão ainda vai no adro. Metaforicamente, que procissões nesta altura é má ideia.

Na fase intermédia podemos ver que a Alemanha, Itália e EUA tiveram mais dificuldade do que a China a travar a propagação. A Alemanha agora está como a Itália estava há uns dez dias mas os EUA estão bem pior. As coisas nos EUA parecem estar a melhorar mas aquele tempo perdido pode ter resultados trágicos. Com crescimento exponencial não se brinca. E um exemplo disso é a Itália. Há quase duas semanas que a Itália tem conseguido manter a taxa de propagação relativamente baixa, entre 1.2 e 1.1. Mas isso não chega, e serviu para ultrapassar a China, porque um crescimento exponencial a 1.1 por dia duplica os casos a cada semana. É uma lição importante para a Alemanha, os EUA e para nós também. O nosso gráfico vai bem encaminhado mas não podemos adiar muito a chegada ao 1.0.

O que me traz à Suécia. Apesar das medidas na Suécia terem sido mais suaves do que nos outros países, a taxa de propagação tem-se mantido baixa. Não faço ideia porquê. Pode ser por factores culturais, pelo clima ou outra coisa qualquer. Mas o que se vê no caso da Itália é que baixo não chega. Se se mantiver em 1.1 eventualmente vai dar em tragédia.

Há quem critique as medidas tomadas em Portugal como extremas. Eu discordo. Portugal tem um avanço em relação à China por ter tomado medidas eficazes mais cedo e está melhor do que a Alemanha e os EUA estavam nesta fase. Mas o factor de crescimento não está muito abaixo do que estava na Itália há vinte dias atrás. É muito importante que o nosso percurso daqui em diante seja mais favorável, mesmo que isso exija sacrifícios.

Actualizei o código na pasta partilhada. Incluí o código que uso para recolher informação desta página do Ministério da Saúde, Ponto de Situação Atual em Portugal. Mas como recorro a API usadas pela página mas não documentadas, recomendo que usem essas funções com moderação não vá alguém chatear-se e mudar a API. Já perdi tempo que chegue com a porcaria dos boletins em pdf, cada um com um formato ligeiramente diferente.

1- Mais sobre isso no post anterior.