terça-feira, 21 de setembro de 2010

Metrô e conspiração: Soninha, cê tá errada

Fiz uma compilação das panes e outros problemas ocorridos no metrô de São Paulo que foram noticiados pela imprensa. Os dados estão disponíveis aqui. O padrão temporal segue no gráfico abaixo (apresentando o total cumulativo dos problemas noticiados - sim, pode ser que me tenha escapado alguns e pode haver alguma subnotificação, mas o padrão não deve ser afetado):

Os quadrados vermelhos indicam as datas dos primeiros turnos das eleições. Os pontos azuis indicam a quantidade de problemas ocorridos até uma determinada data - somando-se todos os eventos ocorridos em datas anteriores (começando por 30/nov/2001).

Se a tese de conspiração defendida por Soninha Francine estivesse correta, esperaríamos que houvesse um aumento na inclinação da curva próximo às datas das eleições. Não é o que ocorre, ao contrário, as maiores inclinações ocorrem nas datas *entre* as eleições.

Upideite(21/set/2010): Pesquisando por "falhas", "metrô", "são paulo" na Folha de São Paulo e acrescentando os dados sobre panes (na figura acima), para o período entre 2007 e 2010, temos o gráfico abaixo:
O triângulo verde indica o início do mês de outubro para os anos sem eleição. Se há um aumento nas falhas para o corrente ano próximo à data da eleição, também há um aumento próximo ao mês de outubro no ano passado.

5 comentários:

Rafael disse...

Idéia maluca que eu tive aqui.. por acaso a inclinação acompanha o aumento dos passageiros? ou seja, estão em paralelo?

Paulo disse...

Péssima escala horizontal.

Deu pra ver que há pouquíssimos dados considerando o longo período mostrado: 32 panes para quase 10 anos. O metrô deve ter algum registro melhor de panes, mas não sei se é fácil de obter.

none disse...

Rafael,

É possível sim. Eu esperaria, nesse caso, um achatamento nos períodos de férias escolares. Não me parece que isso esteja tão claro, no entanto.

Paulo,

A escala horizontal é a que me pareceu natural - englobando todo o período dos dados disponíveis. O pressuposto é que os principais eventos de falha não passariam despercebidos pela imprensa. Pode haver uma ou outra falha: o período entre 2001 e 2006 certamente não tem muitos dados, mas para a parte que interessa de 2008 a hoje parece que há uma boa representação.

[]s,

Roberto Takata

Paulo disse...

Roberto,

Me refiro mais à apresentação da escala que ao seu tamanho. Um tracejado nas datas de eleições já ajudaria na visualização. Mais datas (e não tão quebradas) ajudaria também.

Compreendo que são os dados disponíveis de notícias, mas me parecem poucos, dada a extensão do período. A representatividade da fica questionável, assim como a afirmação de que, com mais dados, o padrão não deve ser afetado.

Enfim, frescuras de engenheiro, hehehe...

none disse...

Paulo,

Como entre 2008 e 2010 parece que há uma boa cobertura, mais dados nos anos anteriores só jogariam o gráfico para cima, sem alterar os "boost" de panes. Por isso que não me parece que novos dados vão alterar o padrão.

Aumentar a escala primária das datas iria mais poluir - até fiz uma limpa da escala automática que a planilha eletrônica havia feito. As linhas verticais podem ajudar, sim. Mas aí teria que editar em algum programa de imagens.

Nada impede, claro, que os interessados peguem os dados que compilei e brinque com eles: estão disponíveis em planilha do Google Docs no link no texto.

Valeu pela visita e pelos comentários.

[]s,

Roberto Takta