segunda-feira, 21 de abril de 2014

Big Data: você sabe o que é?

Foto: http://www.rti.org/
Olá! Retornando de um curto período de férias - tiradas não para descansar, mas para pesquisar e escrever - leio na Folha de São Paulo de hoje, 21/4, a entrevista  que transcrevo abaixo.

Você sabe o que é "big data"? (pronuncia-se big dêita)

Você já se deu conta de quanta informação você fornece, gratuitamente, na internet? Será que é mesmo tão necessário compartilhar tudo, curtir tudo, dar 'check in' em tudo, contar com detalhes a sua rotina e seu percurso diário? Pois é, tudo o que fazemos na internet fica registrado. Esses dados esparsos são o que se chama de "big data". Reunidos e pesquisados, podem revelar muito sobre nós!

É um dos temas que venho estudando: o comportamento das pessoas nas redes sociais (Twitter, Facebook, Instagram, Vimeo, YouTube etc.)

Voltarei em breve a esse tema. Por ora, faça uma pesquisa qualquer no Google. Busque, por exemplo, "batom", "viagem", "cabelos", "emagrecimento", ou o nome de um livro. Clique em alguns links e saia da página de busca.

APOSTA: Da próxima vez que você abrir o Facebook, ou seu portal de notícias preferido, vai ter um anúncio do lado direito da tela falando justamente sobre uma dessas coisas. Ohhhh, que coincidência!!! Quer apostar?

ENTREVISTA DA 2ª:  ANDREAS WEIGEND
Os dados sabem mais sobre você do que você mesmo
Especialista diz que 'big data' faz pessoas tomarem decisões melhores, mas provoca riscos que não podem ser ignorados
Com um smartphone e seus sistemas de GPS e câmeras, as pessoas vão deixando rastros sobre seus gostos e desejos: os lugares que frequentam, os pratos prediletos, os amigos com os quais conversam. O conjunto desse enorme volume de informações permite que empresas saibam o que um consumidor realmente quer com mais eficácia do que ele mesmo.
A opinião é do alemão Andreas Weigend, 54, especialista em "big data", que é o conjunto de tecnologias que permitem coletar e analisar grandes volumes de dados e tentar tirar conclusões sobre o que eles revelam.
Weigend, que foi cientista-chefe da Amazon e hoje dá aulas na Universidade Stanford e presta consultoria, concentra-se nos aspectos sociais e comerciais desse fenômeno: o que informações como a lista de amigos no Facebook ou localização geográfica indicam sobre o comportamento do consumidor.
Segundo ele, "os dados sabem mais sobre você do que você mesmo".
Weigend veio ao Brasil no começo deste mês para conferências e falou com a Folha. Leia abaixo trechos da entrevista.
-
Folha - O que é exatamente "big data"?
Andreas Weigend - "Big data" é uma mentalidade, não é algo definido pelo volume de informações ou pelas ferramentas que você usa. É transformar dados em decisões.

E o que é essa mentalidade?
Eu sou alemão e na minha cidade natal nós tínhamos um filósofo chamado Martin Heidegger, que disse que você só pensa sobre a função do machado quando ele quebra.
Com o "big data" é o mesmo: é a mentalidade que faz os dados e os pensamentos sobre eles desaparecerem. Pense que é como o ar: você não pensa sobre ele no dia a dia, a não ser que ele esteja ruim. O "big data" é não pensar sobre os dados.

O que poderia dar errado para que as pessoas notem os dados?
Eu tenho um amigo que vive em cima de um sex shop em San Francisco e eu o visito frequentemente. Um dia, o Google começou a me mostrar anúncios sobre sexo e eu fiquei surpreso. O motivo é que o sistema de geolocalização do Google não funciona em três dimensões, mas, sim, em duas. Então ele pensa: "Ah, deixa eu ajudar o Andreas, para que ele não tenha de ir ao sex shop de vez em quando, para que ele possa comprar essas coisas pela internet". Isso é um exemplo de algo que geralmente aparece quando há um problema com a análise de dados.

Algum setor ou companhia de fato entendeu como usar o "big data"?
Temos que distinguir a coleta de dados e o refinamento deles. Eu dei uma palestra na ONU há dois anos em que eu dizia que o "big data" é o novo petróleo, porque os dados precisam ser refinados.
Se você só tem dados brutos, em muitos casos eles não o ajudam a tomar uma decisão. Como no caso do petróleo, ganham dinheiro tanto quem tem esse recurso natural, como a Arábia Saudita, quanto quem o refina.
Grande parte das maiores empresas do mundo são do setor de petróleo, como Exxon Mobil e Shell. São as companhias que transformam o petróleo em algo útil.
Do mesmo modo, no caso do "big data", as grandes companhias, aquelas que vão ganhar muito dinheiro, serão aquelas que transformarem essas informações em produtos que permitam que nós tomemos decisões melhores.
Por exemplo, o Google: pega todos os dados do mundo e mostra anúncios para influenciar a decisão das pessoas. O Google Glass é uma máquina coletora de dados.

Nem todo mundo compartilha todos os aspectos da vida na internet. Não há o risco de medir apenas o que as pessoas querem revelar?
Meu telefone sabe melhor como eu durmo do que eu.
Eu tenho um app que analisa o meu sono e outro que me permite tirar fotografias de comida e de um bom vinho. Então o celular identifica muito melhor a relação entre eu ter tomado muitas taças no dia anterior e ter acordado tarde.
De algum modo, a sua operadora de celular, o Google e o Facebook conhecem você melhor do que você se conhece. Eu já trabalhei com sites de namoro como Match.com e eles sabem melhor no que as pessoas estão interessadas do que elas mesmas.
Para ser provocativo, e não tão longe da realidade, os dados sabem mais sobre você do que você mesmo.

Os dados podem saber. Mas as empresas já sabem?
Sim, claro. Veja as recomendações de livros na Amazon. Quantas vezes você não entrou no site deles e adquiriu um livro do qual eles sabiam que você gostaria antes que você se desse conta?
O LinkedIn, por exemplo, sabe muito mais sobre as empresas do que elas mesmas, porque ele identifica a atividade dos profissionais. Essa rede social sabe mais sobre a economia dos Estados Unidos do que o próprio governo, porque consegue ver para onde os recrutadores estão indo, onde estão as oportunidades e o fluxo de empregados entre as empresas.

As pessoas podem não se irritar por ter seus dados rastreados se vão ter algo em troca, como uma boa indicação de produtos. Mas essa tecnologia está sendo usada nos processos de seleção para empregos, por exemplo. Elas podem ser prejudicadas por causa disso.
No passado, decisões sobre quem contratar eram baseadas em informações muito limitadas. Você ia lá, as pessoas conversavam com você, o departamento de recursos humanos fazia algumas ligações para checar suas referências e era isso. Isso era antes do "big data": você controlava o que colocava no currículo e o que dizia na entrevista.
Mas há dois lados disso: os empresários têm agora poder para descobrir mais sobre você e possivelmente usar isso contra você. Mas também há sites como o Glassdoor [em que funcionários e ex-funcionários avaliam as companhias], nos quais é possível conhecer a personalidade da pessoa responsável pela seleção. Então se você identifica que 5 das 6 pessoas que eles contrataram se demitiram após três meses, quais são as chances de você fazer o mesmo?
A questão não é mais se queremos revelar ou compartilhar algo, já que informações que a KGB não conseguia arrancar das pessoas sob tortura estão agora disponíveis na internet. A questão é o que a sociedade vai fazer com essas informações. Se um empregador descobre pelo Facebook que eu sou gay, e ele não quer contratar homossexuais, o que a sociedade vai fazer com isso?

Estamos maduros o suficiente para tomar essas decisões?
Precisamos tomar essas decisões, e cada cidadão tem que pensar nos pontos positivos e negativos desse cenário. Não podemos deixar para o pessoal da tecnologia, para o pessoal que cria modelos de negócio, e esperar que eles façam a coisa certa. Essas são decisões fundamentais que não podemos delegar.

Governos devem regular isso?
É complicado. As consequências de nascer de um lado ou de outro da fronteira são enormes. Novas decisões terão de ser tomadas com base em leis sobre dados? Por exemplo, as pessoas vão querer viver em um país que garante a retenção dessas informações ou em um que as expanda?

No Brasil, está em discussão no Congresso o Marco Civil da Internet, que prevê que empresas do setor sejam obrigadas a guardar informações sobre os usuários. O que o senhor acha disso?
Não tenho conselho. Nosso trabalho é fazer as pessoas pensarem nisso. Outra metáfora possível para o "big data" é a energia nuclear. Muitas pessoas creem que ela pode ser mais eficiente, mas alguns governos decidiram não usá-la porque os riscos envolvidos, mesmo que mínimos, não sobrepujam os benefícios. É o mesmo com os dados: na média, podemos usá-los para tornar o mundo melhor, mas eles também envolvem riscos.

Quais riscos?
Se dados caem em mãos erradas, pessoas podem morrer. Pense na Alemanha, onde as pessoas são muito preocupadas com sigilo. Hitler matou milhões de judeus sem ter computadores. O que ele poderia fazer agora se soubesse por geolocalização quem vai à sinagoga?

FONTE: http://www1.folha.uol.com.br/fsp/mercado/162337-os-dados-sabem-mais-sobre-voce-do-que-voce-mesmo.shtml