Porque os números não são iguais aos do meu WA?
Tá aí uma pergunta que respondo praticamente toda semana (ou tento responder): Porque os número do Ibope (ou ComScore) não são iguais ao do meu Web Analytics?
Bom, acho que o melhor é começar do começo. Uma das primeiras coisas que aprendi em Web Analytics contradisse absolutamente tudo que havia aprendido na Secretaria de Justiça e Segurança do Estado. Na SJS (a Secretaria de Segurança…) trabalhei com estatística criminal (é.. eu contava mortos). Lá exatidão de números era absolutamente TUDO! O número de mortos que a secretaria possuía, tinham que ser iguais aos que a Polícia Civil informava, que a Policia Militar (que lá se chama Brigada Militar) divulgava, e acreditem, ao número de mortos que os jornais contavam. OK. Mas em Web Analytics é exatamente o contrário. Quando duas ferramentas de audiência tiverem exatamente o mesmo número (2.693.457 visitas
) desconfie… algo está errado!
Porque?
Simples cada ferramenta de Web Analytics / Audiência possui a sua forma de mensuração e deve (ou pode) ser utilizada tipos de análises diferentes. Esta é a grande questão do nosso mercado. Vamos usar ferramentas mais populares (não estou usando nenhuma base estatística pra afirmar isto… apenas “feeling”) para exemplificar isto:
Como eles funcionam?
Vamos começar com a Nielsen (nosso velho e bom Ibope Net/Ratings):
Como funciona:
O Ibope é baseado em dados amostrais.
Como assim?
Segundo a Wikipédia:
“Amostra é um subconjunto de elementos pertencentes a uma população. A informação recolhida para uma amostra é depois generalizada a toda a população.
Nem sempre as amostras refletem a estrutura da população de onde foram retiradas ou são representativas dessas populações, podendo levar nesses casos a inferências erradas ou ao enviesamento dos resultados.
As amostras podem ser aleatórias ou não aleatórias.”
Não entendeu? É simples, sabe quando a tua mãe pegava e dizia que todos os meninos que ouviam rock pesado eram viciados? Ou que todas as meninas que iam a bailes funks eram vagabundas? Isto é uma pesquisa amostral.
A tua mãe se baseava em alguns exemplos (o Paulinho do pó, e a Kleusynha do “bloco das sabe tudo”), coletava os dados destas amostras (ele viciado, ela vagabunda) associava isso a alguns dados externos a analise dela (ou a pesquisa) – o Paulinho tinha uma banda de rock pesado, se veste preto e tem cabelo comprido; a Kleusynha tem 15 anos, 3 filhos e quer mais um pra poder viver só de bolsa família) e concluía que todos os jovens que possuíssem características próximas a estas tinham o mesmo tipo de comportamento. Este é um caso típico de uma amostra que não representam o total do universo (mas isso é outra história…)
Para o Ibope são selecionados cerca de 14 mil pessoas, que chamaremos de painelistas (até abril eram cerca de 4 mil) que representam o Universo Brasileiro. Ou seja, se temos no brasil 48% de homens, teremos não amostra 48% de homens. Se temos 17% entre 18 e 24 anos… teremos na amostra também a mesma proporção. Com esta metodologia, e utilizando um número mínimo de pessoas para que os desvios estatísticos (possibilidade de erros) sejam aceitáveis o Ibope evita que erros de avaliação como o das nossas mães não ocorram.
Mas como o Ibope consegue captar os dados de navegação do usuário?
Os dados são coletados a partir das informações obtidas por um software instalado na máquina dos painelistas.
Os painelistas instalam em seu computador um software que permite ao Ibope registrar todas as navegações feitas na máquina. A partir destes dados as informações coletadas são aplicadas ao total do Universo de acordo com o as características da amostra.
E o Google Analytics?
Como funciona:
O Google Analytics é baseado em dados de acessos registrados por cookies nas máquinas dos usuários.
Como assim?
Não, não estamos colocando bolachinhas com gotas de chocolate nas máquinas das pessoas.
Vamos de novo a Wikipédia:
“Cookie é um grupo de dados trocados entre o navegador e o servidor de páginas, colocado num arquivo (ficheiro) de texto criado no computador do utilizador. A sua função principal é a de manter a persistência de sessões HTTP. A utilização e implementação de cookies foi um adendo ao HTTP e muito debatida na altura em que surgiu o conceito, introduzido pela Netscape, devido às consequências de guardar informações confidenciais num computador – já que por vezes pode não ser devidamente seguro, como o uso costumeiro em terminais públicos.
Um exemplo é aquele cookie que um site cria para que você não precise digitar sua senha novamente quando for ao site outra vez. Outros sites podem utilizá-los para guardar as preferências do usuário, por exemplo, quando o sítio lhe permite escolher uma cor de fundo para suas páginas.”
Ou seja, ao entrar em nosso site, o Google Analytics (GA) grava um arquivo .txt (como os que fazemos com o bloco de notas), no qual irá registrar informações sobre a nossa navegação nesse site. Este arquivo será acessado pelo GA que irá unificar todos estes registros e apresentar na ferramenta.
Mas como vocês puderam ver na definição da Wikipédia, muitas vezes o cookie é visto como um arquivo não seguro, já que armazena informações do usuário e disponibiliza para outra máquina (o servidor do GA). Por este motivo, nem todas os acessos realizados ao site serão contabilizados. A gravação do cookie pode ser barrada por diversas configurações de segurança (proxy, firewall e até alguns browsers).
Sendo assim:
O Google Analytics registra os acessos de todos aqueles usuários que permitem gravação de cookies em sua máquina.
Se fossemos comparar os dois, poderíamos dizer que:
Com estas realidades diferentes de contabilização os dados das duas ferramentas realmente não devem ser iguais. Porém, a proporcionalidade das duas deve sim ser a mesma se ambas estiverem bem configuradas. Ou seja, se no Google Analytics 60% da minha audiência vem de uma referência www.AAA.com.br. No Ibope a mesma referência deverá aparecer com a mesma proporção (ou muito próxima).
Ai vem a pergunta clássica:
Mas quais números devo usar?
Depende. Comumente tem-se utilizado os dados da seguinte forma:
- Comparações com a Concorrência
- Análises de tendências do Mercado
- Perfil de Audiência
- Destino de Audiência (para onde foram ao sair do meu site)
- Análises de navegação
- Usabilidade
- Divulgação de dados ao Mercado
- Análises de Fontes de tráfego
E vocês? Como tem usado cada ferramenta?











