Estudo científico comprova: partidos brasileiros não são todos iguais
Não é fácil identificar, através do
discurso dos políticos, as diferenças da linha ideológica que os partidos
defendem. Muito menos se formos nos guiar pela nomenclatura dos partidos:
partidos “progressistas” com atuação conservadora, partidos dos “trabalhadores” que atuam magistralmente a favor do
patronato e do capital, e assim por diante. Por isso não é de
admirar que muitas pessoas, levadas pelo senso comum, acreditem que os partidos
brasileiros sejam todos iguais, o que não é e
nunca foi verdade.
Se alguém precisava de uma prova
científica para mudar essa ideia, ela nos foi proporcionada pelo PoliGNU (Grupo
de estudos de software livre da Escola Politécnica da USP) que realizou uma
pesquisa na qual se faz uma comparação numérica sobre a atuação dos distintos
partidos da Câmara de Deputados. (Veja detalhes do estudo AQUI).
Tomando por base 92 votações na
Câmara sobre os mais distintos assuntos, eles compararam como se posiciona em
cada tema os diferentes partidos. O resultado pode ser visto no gráfico abaixo:
A partir do centro da imagem, que
representa o centro do espectro político-ideológico, temos dois eixos e quatro
direções básicas: direita, esquerda, situação e oposição. O eixo horizontal diz
respeito ao apoio ao governo (situação ou oposição) e o eixo vertical
corresponde à ideologia política (direita ou esquerda) Quanto mais afastado do
centro, mais definido e coerente o partido se apresentou nas votações.
Pelo gráfico, podemos tirar algumas
sentenças: apesar de se dizerem progressistas, os representantes do PT e seus
aliados votaram com uma agenda conservadora (que os posiciona na parte de baixo
da linha horizontal, ou seja, no espetro político da direita; O PCdoB, quem
diria, se posiciona mais à direita do que tradicionais partidos conservadores,
como PR, PRB ou PTB; O PSOL é o partido mais à esquerda do espectro político
nacional, e radicalmente diferente da maioria; O gráfico também ilustra e
derruba uma das maiores falácias da militância petista: apesar de ambos se
posicionarem na oposição, o gráfico mostra que PSOL e PSDB votam completamente
diferentes no Congresso – ou seja, não existe a menor afinidade política entre
esses dois partidos, sendo que a única coisa que têm em comum é a oposição ao
governo (fato devidamente explorado pelos petistas). Por outro lado, são os
próprios deputados petistas que votam com a direita, como ficou demonstrado.
A conclusão mais importante que
podemos tirar desse estudo é que existem sim linhas ideológicas bem definidas
por trás das aparências. E que os partidos mantém uma coerência que pode ser
verificada em suas votações na Câmara. Portanto, mais do que nunca, fica
evidenciado de que os partidos brasileiros não são todos iguais. Cabe aos
eleitores buscarem saber através de informações como votam (e para quem votam)
os deputados, e este estudo é uma ótima ferramenta para se começar a
desmistificar os sensos comuns da política nacional.
Marcadores: politica e sociedade, socialismo e capitalismo
Análise gráfica das votações da câmara dos deputados
Português, Brasil
Update:
O projeto hoje se chama Radar Parlamentar e transformou-se numa ferramenta
interativa que pode ser utilizada em: http://radarparlamentar.polignu.org
Autores:
Autores:
INTRODUÇÃO
Em
nosso primeiro post [1] apresentamos uma comparação numérica entre a atuação dos
partidos na câmara dos deputados baseada nas votações realizadas na câmara. Este
primeiro post rendeu inclusive uma matéria [2] no jornal A Gazeta do Povo, do
Paraná.
Neste novo post
apresentaremos 1) uma nova análise realizada de forma gráfica; 2) uma correção
do cálculo da semelhança, o que resultará em novos valores; e 3) a interpretação
correta para os valores das semelhanças.
ANÁLISE
GRÁFICA
Anteriormente obtivemos
resultados de semelhanças entre partidos dois a dois: podíamos dizer a
semelhança entre PT e PSDB, entre PT e PV, entre PV e PSDB, e assim por diante.
Mas muito mais emocionante do que uma tabela cheia de números é um gráfico que
mostre isso!
Mas tínhamos um grande
problema: como representar todas essas semelhanças em um gráfico ao mesmo tempo?
Note que uma primeira ideia ingênua é fazer com que a semelhança obtida seja
proporcional à distância entre os partidos no gráfico. Mas na verdade fica
impossível desenhar todos os partidos num mesmo plano dessa forma! Se o leitor
não acredita, tente desenhar no papel quatro pontos A, B, C e D obedecendo as
seguintes distâncias: AB=AC=AD=BC=BD=CD=1. Isso não é possível no plano, mas no
espaço com três dimensões teríamos simplesmente o tetraedro regular. Ora, nossos
vetores pertencem a um espaço de 92 dimensões!
Dado
esse problema, um de nós (o Saulo, que não participou do projeto até o primeiro
post) sugeriu o uso da análise de componentes principais, ou PCA [3] na sigla em
inglês.
Trata-se de uma técnica
de análise exploratória de dados, utilizada por exemplo em
data
minning para a extração de
significado de grandes quantidade de dados, em cujas situação a análise manual
seria inviável. Daremos mais detalhes técnicos sobre o PCA na próxima
seção.
E eis que aplicando o
PCA obtivemos o seguinte resultado:
Figura 1 - Resultado gráfico da análise de componentes
principais sobre as votações dos parlamentares na câmara dos deputados
Você pode também obter o gráfico em formato SVG clicando aqui
(ou no anexo do post).
Atenção, os dados de
entrada para essa análise foram as mesmas 92 votações utilizadas no último
post.
Nesta
análise a intenção era colocar todos os partidos, mas deixamos alguns de fora,
pois são pequenos partidos (PRTB, PRP, PSL, e PHS com 1 deputado, e PMN, com 2
[4]) que estiveram totalmente ausentes em pelo menos alguma votação. Essa
característica causa dificuldades matemáticas em nossa análise, e por isso eles
foram excluídos.
COMO
ISTO FOI FEITO // Álgebra linear!
A entrada do algoritmo
PCA é um conjunto de vetores, que no nosso caso são os vetores de votações (cada
partido possui um vetor, em que cada posição representa uma votação e cada valor
representa a posição média do partido em relação à votação daquela
posição).
O que
algoritmo faz na verdade é uma mudança de base, resultando em uma base
ortogonal, de forma que os vetores resultantes apresentem a seguinte
propriedade: o desvio padrão entre os valores da primeira coordenada (na nova
base) dos diversos vetores é máximo. O desvio padrão entre os valores da segunda
coordenada é máximo desde que o segundo vetor da base seja ortogonal ao
primeiro. Ou seja, se tomarmos um conjunto A formado pelos primeiros elementos
de cada vetor da saída do PCA, e um conjunto B formado pelos segundos elementos
de cada vetor da saída do PCA, teremos que o desvio padrão entre os elementos de
A é maior que o desvio padrão dos elementos de B. Portanto, os vetores da nova
base, chamados "componentes principais" são ordenados de forma que o primeiro
deles é na direção da maior dispersão dos dados, o segundo segue a maior
dispersão ortogonal ao primeiro e assim por
diante.
Isso na prática quer
dizer que as diferenças mais significativas entre os partidos foram acumuladas
nas primeiras dimensões! Com isso, utilizamos as duas primeiras dimensões do
vetor de cada partido para definir sua posição em um plano bi-dimensional (nosso
gráfico).
Assim, é como se nosso
gráfico fosse uma espécie de sombra bi-dimensional de um conjunto de dados
multi-dimensionais (no nosso caso 92 dimensões). No entanto não é uma sombra
qualquer, mas sim a sombra projetada de um ângulo que nos mostra muito bem o que
queremos enxergar. De forma análoga, pense na sombra de uma pessoa: ao meio-dia
a sombra da pessoa é aproximadamente um círculo em baixo dela, o que é uma má
aproximação (pois estamos projetando segundo as direções x e y, sendo que a
informação mais significativa está na altura, no eixo z), mas em outros horários
já teremos sombras que revelam a forma humana.
INTERPRETAÇÃO DA
ANÁLISE GRÁFICA // Política!
A primeira coisa
importante a se dizer, é que a posição de cada partido foi totalmente definida
pela análise PCA com base na comparação mútua entre as votações de todos os
partidos.
Os significados dos
eixos obtidos podem ser por nós atribuídos tendo em vista o resultado. Ou seja,
após uma inspeção manual é nossa interpretação que diz
que:
-
O eixo horizontal está relacionado ao apoio ao governo, indo da situação (lado esquerdo) para a oposição (lado direito).
-
O eixo vertical está relacionado à ideologia, indo da esquerda (cima) para a direita (baixo).
Outro fato importante
vindo da análise PCA é que a primeira dimensão é a mais representativa. No nosso
caso, esta “primeira dimensão” corresponde ao nosso eixo horizontal, o que quer
dizer que a semelhança entre os partidos, i.e. a maneira de cada partido votar,
é definida mais em função do apoio que cada partido dá ao governo do que por
suas próprias ideologias. Isso pode ser enxergado através da observação de que o
espectro de apoio ao governo (largura do gráfico) é bem mais amplo do que o
espectro "ideológico" (altura do gráfico). Mais especificamente, a primeira
componente explica 73% da variância, e a segunda explica
9,6%.
Alguns pontos
notáveis:
-
O PT está na “extrema situação”, o que é o resultado mais sensato possível, já que é o partido do governo; mas note que na nossa modelagem matemática nada induzia a isso, logo este resultado foi realmente uma demonstração de incrível poder da análise PCA!
-
Se retirarmos o PSOL, o PT se mantém como o partido mais ideologicamente à esquerda (embora dentro de um espectro ideológico bem mais reduzido).
-
O PSOL se caracteriza como um partido radicalmente diferente de todos os demais.
-
O PV também aparenta ser um caso atípico, porém com posições mais “centralizadas”, mas se afastando o suficiente para justificar a candidatura própria em oposição ao PT.
-
Existem poucos partidos realmente de oposição atuando na câmara. O maior bloco de oposição é o conjunto PSDB, DEM e PPS.
-
Dentro do bloco do governo (Figura 2), o PDT é o partido mais opositor, embora seja (ou “por ser”?) o partido de origem da presidenta!
-
Dentro do bloco do governo, notamos que PP, PSC e PMDB estão mais ideologicamente à direita. Isto pode representar uma tentativa de manter uma mínima identidade ideológica, uma vez condicionado o apoio de forma geral ao governo.
Figura 2 - Mesmo gráfico da análise PCA focada no "bloco
próximo ao governo"
NOVO RESULTADO NA
ANÁLISE NUMÉRICA
Na
análise anterior a posição de um partido sobre uma votação era representado com
um número de 0 a 1, em que 0 representava “todos os deputados do partido votaram
não”, enquanto que 1 representava “todos os deputados do partido votaram sim” (o
valor 0,5 poderia significar a abstenção dos parlamentares ou a divisão de
opiniões dos parlamentares do partido).
No entanto, ao rever os
métodos observamos que utilizar uma faixa de -1 a 1 resultaria em resultados
mais justos do que utilizar a faixa de 0 a 1, no caso de a medida de semelhança
ser o produto escalar. No último post, o leitor Danilo sugeriu nos comentários
que investigássemos também a medida linear de distância, e vamos aproveitar para
discorrer sobre a diferença entre estas duas medidas através do exemplo a
seguir:
Sejam quatro partidos A, B,
C e D, e três proposições x, y e z. O partido A foi unânime nas três votações,
dizendo sim para x e não para y e z, o que representamos assim com as escalas 0
a 1 (sem linha) e -1 a 1 (com linha):
a = (1,0,0); a'=
(1,-1,-1)
Analogamente, os outros
partidos votaram como segue:
b = (0,1,0); b'=
(-1,1,-1)
c = (0,0,0).
c'=(-1,-1,-1)
d = (0,1,1);
d'=(-1,1,1)
Comparando com o partido A, é
nítido que o partido D é o mais ortogonal: votou o contrário do A em todas as
proposições. Gostaríamos que a semelhança entre eles fosse zero. Já o partido C
votou como A em duas proposições e diferiu apenas em uma, e B diferiu de A em
duas. Observe as semelhanças abaixo (calculadas com o produto escalar) e note
como a escala entre 0 e 1 não reflete estas observações. Ao lado, mostramos
também a distância em linha reta entre os dois vetores, que traz mais
informação: por exemplo a distância maior está entre os partidos A e D, que
discordam em tudo:
sem(a,b) = 0 % dist(a,b) =
1,41
sem(a,c) = 0 % dist(a,c) =
1
sem(a,d) = 0 % dist(a,d) =
1,73
Já na escala entre
-1 e 1 temos:
sem(a',b') = 33%
dist(a',b') = 2*1,41 = 2,82
sem(a',c') = 67%
dist(a',c') = 2*1 = 2,00
sem(a',d') = 0% dist(a',d')
= 2*1,73 = 3,46
A medida de distância
simplesmente foi multiplicada por dois. Já a semelhança tal como medida pelo
produto escalar nos trouxe informações interessantes: a semelhança entre A e D
resultou zero, o que nos diz imediatamente que os dois discordam sempre. É fácil
ver que para ter 100% dois partidos teriam que concordar sempre, e a semelhança
de A com B e C mostra valores graduais. Concluímos que o valor obtido com o
produto escalar apresenta uma interpretação mais direta do que a distância
linear, em termos de porcentagens. Essa interpretação será explorada com mais
detalhes na próxima seção.
Contudo, uma observação
interessante é que o resultado da análise gráfica (resultado da PCA) é o mesmo
tanto para os antigos vetores de votações, quanto para os novos vetores agora
apresentados. Isso acontece justamente porque na PCA estamos tratando das
distâncias (e posições relativas) entre os partidos, e não propriamente dos
ângulos. Para a PCA, a posição da origem (o zero) não faz diferença (pois ela é
reposicionada na média no início da análise, afim de colocar em evidência as
diferenças). O resultado visual que temos no gráfico reflete as distâncias
lineares entre os partidos, e nada tem a ver com os
ângulos.
Após
efetuar tal alteração, obtivemos uma nova lista de semelhança entre os partidos.
Confira a nova lista de semelhança entre os partidos clicando
aqui.
O efeito observado foi
de que maneira geral os partidos se aproximaram, ou seja, eles
todos são mais parecidos ainda do que supunha a análise anterior. No
entanto os “agrupamentos de partidos” se mantiveram os mesmos,
como por exemplo: o PSDB continua sendo mais próximo ao DEM do que ao
PT.
INTERPRETAÇÃO
DOS VALORES NUMÉRICOS DAS SEMELHANÇAS
Um problema da análise
anterior, é que o valor obtido de semelhança (aquela porcentagem) não tinha uma
interpretação direta. Por exemplo, dada a semelhança de 43% entre PT e PSDB, o
que significa esse 43%?
Alguém poderia ser
tentado a dizer que o PSDB apoiou o PT em 43% das propostas analisadas. Mas na
verdade não é bem isso... o resultado era apenas uma quantificação para dar a
ideia desse nível de apoio, mas a interpretação não era tão
direta.
Com o novo método
apresentado na seção anterior para o cálculo da semelhança, formulamos uma
interpretação mais concreta para os números.
A interpretação nem sempre é
direta porque os partidos têm nuances nas votações, e nem sempre votam "em
bloco" (diremos que o partido vota "em bloco" quando todos do partido votam
igual em uma votação). Contudo é possível explicar com palavras simples em
alguns casos particulares.
O caso particular mais simples
é o caso em que os dois partidos, A e B, votam sempre em bloco, em todas as
votações. Neste caso, o valor 43% é a porcentagem de votações em que os dois
partidos concordaram, e o complemento, 57%, é a porcentagem em que
discordaram.
Um caso particular menos
restritivo é o caso em que um dos partidos, por exemplo o partido A, sempre vota
em bloco, mas o partido B pode apresentar divisões internas em algumas questões.
Vamos supor que o partido B tenha 4 parlamentares, e que em certo período foram
feitas 25 votações. Neste caso, houveram 100 votos do partido B, 4 para cada uma
das 25 votações. O número 43% nos diz então que 43 destes 100 votos foram
concordantes com a opinião do partido A (que tem sempre uma opinião única nas
votações), e os demais votos foram discordantes.
No caso geral em que também o
partido A apresenta divisões internas, uma interpretação em palavras do valor
43%, que seja ao mesmo tempo correta e completa, começa a ficar mais complicada.
No exemplo acima, como há 25 votações, cada uma delas corresponde a 4% do total.
Para as votações mais simples de analisar, em que os dois partidos, A e B,
votaram em bloco, ou eles concordaram plenamente ou discordaram plenamente. Se
concordaram soma-se 4% na semelhança entre os dois, e se discordaram não se soma
nada. Para uma votação em que, por exemplo, os 4 parlamentares de B se
dividiram, apenas 3 concordando com A enquanto que o quarto discordou, somamos
apenas 3%. Para as votações em que ambos os partidos se dividiram, a porcentagem
a somar seria:
4% * (%Asim * %Bsim + %Anão
* %Bnão)
Onde o 4% = (100%) / (Número
de votações) representa a semelhança máxima que pode ser advinda daquela
votação; se houvessem 100 votações cada votação "valeria" apenas 1%. A fórmula
acima funciona, é claro, também nos casos particulares em que há votações em
bloco.
Exemplo: Em uma dada
votação os votos se distribuíram como segue:
A votou sim sim sim sim não -> representado na
álgebra por (1+1+1+1-1)/5 = 0,6
B votou não sim não não
-> representado na álgebra por (-1+1-1-1)/4 = -0,5
4% * (%Asim * %Bsim + %Anão
* %Bnão) = 4% * (.8*.25 + .2*.75) = 4% * (.2 +.15) =1,4%
No produto escalar, esta
coordenada (votação) irá contribuir com 0,6*-0,5 = -0,3. Como o mapeamento é 0%
para -1 e 100% para +1, a contribuição seria 35% do máximo que se pode atingir,
o que mostra que os dois jeitos de pensar (com a álgebra ou com as porcentagens)
são equivalentes.
PRÓXIMOS
PASSOS
-
Questionar a câmara porque os web services retornaram apenas 27 das 693 proposições votadas em 2011. A totalidade desses dados seria importante para obter um resultado mais preciso!
-
Obter dados de anos anteriores, o que possibilitará uma “análise temporal”. Idealmente esses dados devem ser desde 1988.
-
Obter dados sobre os partidos com ministérios em cada ano, assim podemos relacionar o apoio ao governo nas votações da câmara com a ceção de ministérios para esses partidos.
-
Analisar que votações contribuem mais para os primeiros componentes principais, afim de descobrir (automatica- e matemagicamente) quais são as questões "polêmicas", que causam mais divergências na câmara.
-
Avaliar as dispersões internas entre os partidos.
-
Incluir o tamanho dos partidos na representação gráfica.
REFERÊNCIAS
[1] Primeiro post sobre
o camaraws: http://projeto/camaraws/análise-automatizada-da-semelhança-entre-os-partidos-políticos
[2] Matéria no jornal
Gazeta do Povo sobre o camaraws: http://www.gazetadopovo.com.br/vidapublica/conteudo.phtml?tl=1&id=1217527&tit=Fidelidade-a-toda-prova
[3] Análise de
componentes principais (PCA): http://en.wikipedia.org/wiki/Principal_component_analysis
[4] Tamanho das bancas
dos partidos na câmara: http://www2.camara.gov.br/deputados/liderancas-e-bancadas
Projeto:
21 comments
Muito bacana!
Enviado por Anônimo em ter, 14/02/2012 - 16:19Situação versus Oposição
Enviado por Anônimo em ter, 14/02/2012 - 16:20Leonardo,Novamente parabéns.
Enviado por Anônimo em ter, 14/02/2012 - 18:59Nossa, apesar de não entender
Enviado por Anônimo em ter, 14/02/2012 - 21:15Muito interessante, parabéns!
Enviado por Anônimo em ter, 14/02/2012 - 22:34Eu ia sugerir exatamente o que vocês planejaram pros próximos passos: "Incluir o tamanho dos partidos na representação gráfica". A maneira mais direta que vejo é a área do círculo sendo proporcional ao tamanho do partido.
Uma outra coisa bastante interessante seria usar dados de anos anteriores, como vocês planejam, e criar um gráfico "animado", como esse do Google (http://code.google.com/apis/chart/interactive/docs/gallery/motionchart.html#Example), e ver como os partidos se movimentam com o tempo (os que mudam de ideologia, mudam de situação pra oposição, mudam de grupos, etc).
Eixo ideológico
Enviado por Anônimo em qua, 15/02/2012 - 00:09Respondendo às perguntas
Enviado por Anônimo em qua, 15/02/2012 - 09:23@leofl acho que essa parte
Enviado por Anônimo em qua, 15/02/2012 - 22:08s/a variância restante/a
Enviado por Anônimo em qua, 15/02/2012 - 22:15Fidelidade partidária
Enviado por Anônimo em qua, 15/02/2012 - 10:05Olá Jorge,
Enviado por leofl em qua, 15/02/2012 - 14:57de fato, até já no deram também essa ideia de fazer "manchas de deputados" em vez de circunferências de partidos. Espero que cheguemos lá!
Mas quanto ao tamanho do partido ser representado, acredito que já será para mais em breve.
Sugestão nas melhorias
Enviado por Anônimo em qui, 16/02/2012 - 20:24Espero que cheguemos lá!
Enviado por leofl em ter, 21/02/2012 - 23:04Parabéns
Enviado por Anônimo em sex, 17/02/2012 - 10:44Olá Max,
Enviado por leofl em ter, 21/02/2012 - 23:12em primeiro lugar, a sacada da ACP devemos ao Saulo! :)
O "total da variância explicada para os dois eixos" está no post. É de 73% para o eixo horizontal e 9,6% para o eixo vertical.
> "foram mais de 600 votações, mas nem todas foram nominais, o que não entra no sistema da câmara, das nominais não foram 100"
desculpa, não entendi sua frase... só sei que das mais de 600 proposição, só conseguimos analisar 27 proposições (mais de 90 votações)
Como assim "analisando por redes"? num saquei x)
Quanto ao gráfico animado, é o que queremos fazer! =D
Partido duplicado
Enviado por Anônimo em sex, 17/02/2012 - 16:43Achei a origem desta
Enviado por Anônimo em sex, 17/02/2012 - 16:53Nossa, muito obrigado Marcos!
Enviado por leofl em ter, 21/02/2012 - 23:07Legal, esta é a ideia toda do software livre, permitir que a comunidade encontre erros e participe do desenvolvimento =)
Ótimo trabalho, mas o povo não entende nada.
Enviado por Anônimo em sex, 20/07/2012 - 10:54Pena que quem entende tudo isso, no universo "povo brasileiro", são duas minorias desse país varonil: os menos de 1% que têm acesso à educação superior de qualidade (ainda assim me questiono se realmente a totalidade do 1% entende esse trabalho), mas que são totalmente deixados de lado pelo governo; e os tradicionais grupos ricos que realmente dão as cartas nesse país (situação da qual a maioria massacrante daquele "povo brasileiro" se convence, erroneamente, de que não há como reverter esse quadro).
Mas para graduandos, graduados e pós-graduados, esse trabalho é muito interessante e de leitura obrigatória, independente das opiniões ideológicas. Vamos ver se a galera entende. Poderia ser uma mudança de rumo desse país.
Valeu!
Mudanças
Enviado por diraol em ter, 07/08/2012 - 02:10obrigado pelos elogios!
Acho que parte desse nosso trabalho é a crença na mudança de paradigmas, quem sabe juntar o "saber popular" com o "saber científico" e com o "saber digital", e fazer sair dai algo de diferente. Levar a cultura hacker além do submundo da tecnologia. Não que isso seja fácil, mas se não começarmos nunca chegaremos lá né?!
Abraços!