Como seus amigos no Twitter podem revelar seu anonimato

: By Jessica Su, Universidade de Stanford

Obrigado pela visita InnerSelf.com, onde existem 20,000+ artigos que alteram vidas promovendo "Novas Atitudes e Novas Possibilidades". Todos os artigos são traduzidos para Mais de 30 idiomas. Subscrever à InnerSelf Magazine, publicada semanalmente, e ao Daily Inspiration de Marie T Russell. Revista Innerself é publicado desde 1985.

quebrar

Como seus amigos no Twitter podem lhe dar seu anonimato

À medida que você navega na internet, os anunciantes on-line rastreiam quase todos os sites que você visita, acumulando uma grande quantidade de informações sobre seus hábitos e preferências. Quando você visita um site de notícias, eles podem ver que você é fã de basquete, óperas e romances de mistério e, consequentemente, selecionam anúncios adaptados ao seu gosto.

Os anunciantes usam essas informações para criar experiências altamente personalizadas, mas normalmente não sabem exatamente quem você é. Eles observam apenas sua trilha digital, não sua própria identidade, e assim você pode sentir que manteve um grau de anonimato.

Mas, em um artigo, eu coautoria com Ansh Shukla, Sharad Goel e Arvind Narayanan, mostramos que esses registros anônimos de navegação na web podem, na verdade, estar vinculados a identidades do mundo real.

Para testar nossa abordagem, construímos um site onde as pessoas poderiam doar seu histórico de navegação para os propósitos deste estudo. Em seguida, tentamos ver se poderíamos vincular seus históricos aos perfis do Twitter usando apenas dados disponíveis publicamente. Setenta e dois por cento das pessoas que tentamos re-denominar foram identificadas corretamente como o principal candidato nos resultados de pesquisa, e 81 por cento estavam entre os melhores candidatos 15.

privacy2 2 8 Capturas de tela do site do deanonymization.

Isso é, até onde sabemos, a maior demonstração de desnomonização até hoje, já que ele seleciona o usuário correto de centenas de milhões de possíveis usuários do Twitter. Além disso, nosso método exige apenas que uma pessoa clique nos links que aparecem em seus feeds de mídia social, e não que eles postem qualquer conteúdo - por isso mesmo as pessoas que são cuidadosas com o que compartilham na Internet ainda estão vulneráveis a esse ataque.

Como Funciona

Em alto nível, nossa abordagem é baseada em uma observação simples. Cada pessoa tem uma rede social altamente distintiva, composta por familiares e amigos da escola, do trabalho e de vários estágios de sua vida. Como conseqüência, o conjunto de links em seus feeds do Facebook e Twitter é altamente distinto. Clicar nesses links deixa uma marca no seu histórico de navegação.

Ao olhar para o conjunto de páginas da Web que um indivíduo visitou, pudemos escolher feeds de mídia social semelhantes, gerando uma lista de candidatos que provavelmente geraram esse histórico de navegação na web. Dessa maneira, podemos vincular a identidade do mundo real a um conjunto quase completo de links que eles visitaram, incluindo links que nunca foram publicados em qualquer site de mídia social.

Executar esta estratégia envolve dois desafios principais. A primeira é teórica: como você quantifica o quão semelhante é um feed de mídia social específico para um dado histórico de navegação na web? Uma maneira simples é medir a fração de links no histórico de navegação que também aparecem no feed. Isso funciona razoavelmente bem na prática, mas exagera semelhanças com feeds grandes, já que eles simplesmente contêm mais links. Em vez disso, adotamos uma abordagem alternativa. Apresentamos um modelo estilizado e probabilístico do comportamento de navegação na Web e, em seguida, calculamos a probabilidade de um usuário com esse feed de mídia social gerar o histórico de navegação observado. Em seguida, escolhemos o feed de mídia social mais provável.

O segundo desafio envolve identificar os feeds mais semelhantes em tempo real. Aqui nos voltamos para o Twitter, uma vez que os feeds do Twitter (em contraste com o Facebook) são em grande parte públicos. No entanto, mesmo que os feeds sejam públicos, não podemos simplesmente criar uma cópia local do Twitter contra a qual podemos executar nossas consultas. Em vez disso, aplicamos uma série de técnicas para reduzir drasticamente o espaço de pesquisa. Em seguida, combinamos técnicas de cache com rastreamentos de rede sob demanda para construir os feeds dos candidatos mais promissores. Neste conjunto reduzido de candidatos, aplicamos nossa medida de similaridade para produzir os resultados finais. Dado um histórico de navegação, normalmente podemos realizar todo este processo em segundos de 60.

Nosso método é mais preciso para pessoas que navegam no Twitter mais ativamente. Noventa por cento dos participantes que clicaram no 100 ou mais links no Twitter podem ser compatíveis com sua identidade.

Muitas empresas têm os recursos de rastreamento para realizar um ataque como este, mesmo sem o consentimento do participante. Tentamos desnonymizar cada um dos participantes do experimento usando apenas as partes de seus históricos de navegação que eram visíveis para empresas de rastreamento específicas (porque as empresas têm rastreadores nessas páginas). Descobrimos que várias empresas tinham recursos para identificar com precisão os participantes.

Outros estudos de desnomonização

Diversos outros estudos utilizaram pegadas publicamente disponíveis para desnatar dados sensíveis.

Talvez o estudo mais famoso ao longo destas linhas tenha sido realizado por Latanya Sweeney na Universidade de Harvard em 2002. Ela descobriu que 87 por cento dos americanos eram exclusivamente identificáveis com base em uma combinação de seu código postal, sexo e data de nascimento. Esses três atributos estavam disponíveis tanto em dados de registro de eleitores públicos (que ela comprou por US $ 20) quanto em dados médicos anônimos (que eram amplamente distribuídos, porque as pessoas achavam que os dados eram anônimos). Ao conectar essas fontes de dados, ela encontrou os registros médicos do governador de Massachusetts.

Em 2006, Netflix criou um concurso para melhorar a qualidade de suas recomendações de filmes. Eles lançaram um conjunto de dados anônimos da classificação de filmes das pessoas e ofereceram US $ 1 milhões para a equipe que poderia melhorar seu algoritmo de recomendação em 10 por cento. Cientistas da computação Arvind Narayanan e Vitaly Shmatikov notou que os filmes que as pessoas assistiam eram muito distintos, e a maioria das pessoas no conjunto de dados era exclusivamente identificável com base em um pequeno subconjunto de seus filmes. Em outras palavras, com base nas escolhas de filmes da Netflix e nas análises do IMDB, os pesquisadores conseguiram determinar quem eram os usuários da Netflix.

Com o surgimento das mídias sociais, mais e mais pessoas estão compartilhando informações que parecem inócuas, mas na verdade revelam muitas informações pessoais. Um estudo liderado por Michal Kosinski na Universidade de Cambridge usou o Facebook gosta de prever pessoas orientação sexual, visões políticas e traços de personalidade.

Outra equipe, liderada por Gilbert Wondracek na Universidade de Tecnologia de Viena, construímos uma “máquina de desnomonização” que descobriu de quais grupos as pessoas faziam parte da rede social Xing, e usaram isso para descobrir quem eram - já que os grupos dos quais você faz parte são suficientes para identificar exclusivamente você.

O que você pode fazer

A maioria desses ataques é difícil de defender, a menos que você pare de usar a internet ou participe da vida pública.

Mesmo se você parar de usar a internet, as empresas ainda poderão coletar dados sobre você. Se vários de seus amigos fizerem o upload de seus contatos telefônicos para o Facebook e seu número estiver em todas as listas de contatos, o Facebook poderá fazer previsões sobre você, mesmo que você não use o serviço deles.

A melhor maneira de se defender contra algoritmos de desnomonização como o nosso é limitar o conjunto de pessoas que têm acesso aos seus dados de navegação anônimos. Extensões do navegador como Ghostery bloquear rastreadores de terceiros. Isso significa que, mesmo que a empresa cujo website esteja visitando saiba que você está visitando, as empresas de publicidade que exibem anúncios em suas páginas não poderão coletar seus dados de navegação e agregá-los em vários sites.

Se você é um webmaster, pode ajudar a proteger seus usuários, permitindo que eles naveguem pelo site usando HTTPS. A navegação usando HTTP permite que invasores obtenham seu histórico de navegação farejando o tráfego de rede, o que permite que eles realizem esse ataque. Muitos sites já mudaram para HTTPS; Quando repetimos nosso experimento de desdenonização da perspectiva de um farejador de tráfego de rede, apenas 31 por cento dos participantes poderia ser desnonymized.

No entanto, há muito pouco que você pode fazer para se proteger contra ataques de desanonimização em geral, e talvez o melhor curso de ação seja ajustar as expectativas. Nada é privado nesta era digital.

Sobre o autor

Jessica Su, Ph.D. Estudante em Stanford, Universidade de Stanford

Este artigo foi originalmente publicado em A Conversação. Leia o artigo original.

Livros relacionados

at InnerSelf Market e Amazon

quebrar

Obrigado pela visita InnerSelf.com, onde existem 20,000+ artigos que alteram vidas promovendo "Novas Atitudes e Novas Possibilidades". Todos os artigos são traduzidos para Mais de 30 idiomas. Subscrever à InnerSelf Magazine, publicada semanalmente, e ao Daily Inspiration de Marie T Russell. Revista Innerself é publicado desde 1985.

Idiomas disponíveis

siga InnerSelf on

Autores InnerSelf

uma pessoa reabastecendo uma garrafa de água potável em uma torneira externa

Dia da Terra: Como promover a mudança de comportamento

Preety Sharm e Ayeshah Haque, Universidade de Toronto

Os organizadores do Dia da Terra apelam a uma educação climática generalizada como um passo crítico na luta contra as alterações climáticas. Um novo relatório…

uma lata de lixo comercial cheia até a borda com frutas e vegetais jogados fora

4 estratégias eficazes para reduzir o desperdício de alimentos

Amar Laila, Universidade de Guelph, et al.

O sistema alimentar global produz alimentos suficientes para todos, mas, em 2023, 333 milhões de pessoas em todo o mundo sofriam de insegurança alimentar e 783 milhões…

Vamos fazer o Dia da Terra sobre a Terra, não nós

Como comemorar o “aniversário” da Terra e fazer com que seja sobre ela, não sobre nós

Shahid Naeem, Universidade de Columbia

Hoje é o Dia da Terra, mas é um dos dias comemorativos mais confusos e equivocados do ano. A ONU se refere a este dia como o…

mãos segurando um monte de terra coberta de grama com um riacho passando por ele e uma árvore no topo.

Inspiração diária do InnerSelf: 22º de abril de 2024

Carol Dia

A Inspiração Diária é uma mensagem curta para ajudar a definir o tom do dia. Ele está vinculado a um artigo mais longo para informações adicionais e…

lâmpada com filamentos internos em forma de coração

Revista InnerSelf: 22 de abril de 2024

Funcionários Innerself

A energia está em tudo e é tudo. A energia está em nossas casas, não apenas na forma de eletricidade, mas na forma de cores,…

MAIS LEIA

A surpreendente ascensão dos Mumpreneurs que conquistam a China de assalto!

Lisa Xiong, EM Lyon Business School

Embora muita tinta tenha sido derramada sobre o crescimento económico da China nas últimas décadas, as contribuições das mulheres chinesas recebem frequentemente menos…

Eco-cidades a que custo? A Batalha pelas Terras Indígenas

Michelle Mielly, Grenoble École de Management (GEM)

Quando a noção de “ecoturismo” foi introduzida no final da década de 1970, pretendia ser ecologicamente responsável, promover a conservação,…

Como a IA influencia as eleições e o que você pode fazer

Nick Hajli, Universidade de Loughborough

Desinformação eleitoral: como funcionam os bots alimentados por IA e como você pode se proteger de sua influência

uma mulher com os olhos fechados apoiando a testa nos punhos fechados com as mãos em "algemas" de contas

Proteja-se do esgotamento emocional com a “Declaração de Direitos” do Empath

Judith Orloff, MD

Um dos maiores obstáculos à empatia é o medo de ficar vulnerável e depois sobrecarregado. Parece muito doloroso ou inseguro para…

Os proprietários de carros mais antigos são bons para o meio ambiente?

Gaëtan Mangin, Université d'Artois

Exploramos a propriedade e o uso de carros com mais de 20 anos. Revelou que, longe de ser hostil aos imperativos de…

Como a economia tradicional interpreta mal as soluções para as alterações climáticas

Junaid B. Jahangir, Universidade MacEwan

Um economista explica: A economia dos livros didáticos apresenta graves falhas quando se trata de mudanças climáticas...

ÚLTIMAS

Dia da Terra: Como promover a mudança de comportamento

Os organizadores do Dia da Terra apelam a uma educação climática generalizada como um passo crítico na luta contra as alterações climáticas. Um novo relatório…

4 estratégias eficazes para reduzir o desperdício de alimentos

O sistema alimentar global produz alimentos suficientes para todos, mas, em 2023, 333 milhões de pessoas em todo o mundo sofriam de insegurança alimentar e 783 milhões…