226 111 3MB
Portuguese Pages 184 Year 2000
Análise de Redes para
Mídia Social
CONSELHO EDITORIAL DA COLEÇÃO CIBERCULTURA Adriana Amaral André Lemos Alex Primo Clóvis Barros Filho Denize Araújo Erick Felinto Fernanda Bruno Francisco Menezes Juremir Machado da Silva Luis Antônio Paim Gomes Paula Sibilia Raquel Recuero Simone Pereira de Sá Vinicius Andrade Pereira
Análise de Redes para
Mídia Social Raquel Recuero Marco Bastos Gabriela Zago
© Xxxxxxxxxxxxx Capa: xxxxxxxxxxxxxxx Editoração: Vânia Möller
Revisão: xxxxxxxxxxxxxxxxx Revisão gráfica: xxxxxxxxxxxxxx
Editor: Luis Antônio Paim Gomes Dados Internacionais de Catalogação na Publicação CIP
Bibliotecária Responsável: Denise Mari de Andrade Souza – CRB 10/960
R352a
Recuero, Raquel Análise de redes para mídias sociais / Raquel Recuero, Marco Bastos e Gabriela Zago. – Porto Alegre: Sulina, 2015. -- p. (Coleção Cibercultura) ISBN: 978-85-205-0733-9
1. Redes Sociais. 2. Mídias Sociais. 2. Comunidades Virtuais. 3.Comunicação Digital. 4. Cibercultura. I. Título. II. Bastos, Marco. III. Zago, Gabriela. CDU: 004.738.5 316.77 CDD: 303.483
Todos os direitos desta edição reservados à Editora Meridional Ltda. Av. Osvaldo Aranha, 440 cj. 101 – Bom Fim Cep: 90035-190 Porto Alegre-RS Tel: (0xx51) 3311-4082 www.editorasulina.com.br e-mail: [email protected] {Xxxxxxx/2015}
IMPRESSO NO BRASIL/PRINTED IN BRAZIL
Este livro foi possível graças ao apoio de inúmeros órgãos e parceiros. Agradecemos a Antonia Zago pela cuidadosa revisão. Também agradecemos o apoio do CNPq (projetos 408650/2013-3 e 300567/2013-8) e da FAPERGS (projeto 12/1878-5). Finalmente, agradecemos ainda ao Centro de Computação Eletrônica da USP.
Sumário
Prefácio – Marc A. Smith .............................................................................
9
Introdução: Sobre Mídia Social ...............................................................
21 22 27 30 32
Redes Sociais na Internet e Sites de Rede Social ............................ Conceito de Mídia Social ............................................................................. Públicos em Rede ......................................................................................... Mídia Social, Opinião e Esfera Pública .................................................
1. O que é Análise de Redes Sociais? .................................................... 1.1 Definição .................................................................................................... 1.2 Antecedentes da Análise de Redes Sociais ................................. 1.2.1 Sociometria .................................................................................... 1.2.2 Teoria dos grafos ..........................................................................
2. ARS: Principais Elementos .................................................................... 2.1 Nós e Arestas ............................................................................................ 2.2 Grupo ........................................................................................................... 2.3 Capital Social ............................................................................................. 2.4 Rede Inteira e Rede Egocentrada ..................................................... 2.5 Rede de Dois Modos ou Bipartidas .................................................. 2.6 Grafos direcionados e não direcionados ...................................... 2.7 Métricas de ARS ..................................................................................... 2.7.1 Métricas de Nó ............................................................................. 2.7.1.1 Grau do Nó ....................................................................... 2.7.1.2 Grau de Intermediação (Betweenness) .............. 2.7.1.3 Grau de Proximidade (Closeness) ......................... 2.7.1.4 Centralidade Autovetor (Eingenvector) ............. 2.7.1.5 PageRank .......................................................................... 2.7.2 Métricas de Rede ......................................................................... 2.7.2.1 Densidade ......................................................................... 2.7.2.2 Grupabilidade ou Clustering ................................... 2.7.2.3 Buracos Estruturais ...................................................... 2.7.2.4 Modularidade ................................................................. 2.7.2.5 Centralização ..................................................................
37 39 41 44 45 53 54 56 57 59 62 64 65 66 67 69 70 72 74 75 76 77 80 84 86
3. Coleta e Análise de Dados .................................................................... 3.1 Coleta de Dados ...................................................................................... 3.2 Softwares e Crawlers ............................................................................. 3.3 Análise de Dados .................................................................................... 3.3.1 Visualização de Dados ................................................................ 3.3.1.1 Fruchterman-Reingold .............................................. 3.3.1.2 ForceAtlas e ForceAtlas2 ........................................... 3.3.1.3 Yifan Hu ............................................................................. 3.3.1.4 OpenOrd .......................................................................... 3.4 Problemas Éticos e Limitações .........................................................
4. Aplicações de ARS para Mídia Social ..............................................
89 90 93 97 98 101 103 104 105 106 111 112 113
4.1 Estudos de Participação Política ..................................................... 4.1.1 Twitter e Debates Eleitorais .................................................... 4.2 Estudos de Discurso Mediado por Computador e Redes Sociais ................................................................................................................. 4.2.1 Racismo e Xenofobia on-line: Caso das Eleições 2014 4.3 Jornalismo e Mídia Social ................................................................... 4.3.1 Cobertura programada: #EstadaonaCopa ..................... 4.3.2 Cobertura emergente: Podolski brasileiro .......................
132 136 146 149 154
À guisa de conclusão: O Campo .............................................................
163
Posfácio – Fabrício Benevenuto ..............................................................
165
Referências ...........................................................................................
173
Prefácio Conectando o poder das redes sociais Marc A. Smith
Dizem que vivemos em uma sociedade em rede. Redes de computadores hoje são lugares comuns. Serviços de redes sociais já são tidos como parte do cotidiano das pessoas. As redes estão em todos os lugares. E, ainda assim, a compreensão dessas redes é nebulosa para muitos. O que você usa para coletar uma rede? Onde você armazena esses dados? Como você analisa ou visualiza uma rede? Qual é a melhor maneira de transmitir percepções de uma rede para outras pessoas? De forma contrastante em relação a outras estruturas de visualização de dados, como gráficos em barra e em pizza, as redes estão fora do alcance da maioria das pessoas. Programadores conseguem, com frequência, desenvolver as habilidades e técnicas necessárias para coletar, analisar, visualizar e reportar redes, mas outras pessoas encontram desafios significativos ao atacar o mesmo problema. As redes estão em todos os lugares e os modelos de rede são bastante úteis para compreendê-las. Assim, superar obstáculos para usar métodos de análise de re9
10
des é importante. A perspectiva de rede é holística e gestaltiana – ela foca nos padrões emergentes compostos de coleções de relações, mais do que em grupos de indivíduos isolados. Os métodos de análise de rede capturam as formas através das quais um mesmo número de pessoas pode formar padrões bastante diferentes de conexões. Uma perspectiva de rede reconhece o papel central das relações entre os indivíduos, mais do que dos indivíduos isolados, nos estudos da sociedade. Compreender o mundo através das redes ganhou importância com a revolução da mídia social, que absorveu bilhões de pessoas. Enquanto conectamos coisas, “curtimos”, aceitamos amigos, retuitamos, “favoritamos” e seguimos uns aos outros, formamos redes de relações que agora são mais visíveis do que jamais foram. O uso massivo da mídia social torna as conexões entre as pessoas mais visíveis e mais facilmente coletáveis, revelando um panorama de associações humanas. Esse panorama não é simples. As redes sociais humanas tomam formas variadas, cada uma refletindo um tipo de processo social gerador diferente. Décadas de pesquisa em comportamento organizacional mostraram que nem todas as formas de rede são boas para todas as tarefas. Assim, saber em qual tipo de rede você está e onde você se posiciona nesta estrutura é essencial para a performance organizacional e para as carreiras individuais. Enquanto as organizações adotam a mídia social para colaboração e comunicação, há uma necessidade crescente de ferramentas que auxiliem a mapear e a medir redes sociais empresariais. Enquanto nossa sociedade adota a mídia social como um novo fórum para o discurso público, criando uma praça pública virtual, há uma necessidade crescente de ferra-
mentas e métodos que possam documentar esses espaços, da mesma formo como a gravação de vídeos e a fotografia definem a produção de notícias no mundo físico. Redes são estruturas de dados comumente encontradas em quaisquer serviços de mídia social que permitam às pessoas construir grupos de conexões. Vivemos hoje em um mar de tweets, posts, blogs e atualizações vindas de uma fração significativa da população no mundo conectado. As nossas relações pessoais e profissionais atualmente são baseadas tanto em textos, emails, chamadas de celular, fotos, vídeos, documentos, slides e jogos quanto em interações face a face. A mídia social pode ser um fluxo desconcertante de comentários, uma assustadora mangueira de incêndio esparramando conteúdo. Com melhores ferramentas e um pequeno conjunto de conceitos da ciência social, o enxame de comentários, favoritos, etiquetas, curtidas, avaliações, atualizações e links pode revelar pessoas-chave, tópicos e subcomunidades. Quanto mais interações sociais moveram-se para grupos de dados que podem ser lidos por máquinas, mais novas ilustrações das relações humanas e organizacionais se tornam possíveis. Mas novos formatos de dados requerem novas ferramentas para coletar, analisar e comunicar percepções. A compreensão da opinião pública é, por si só, um processo social. O uso de redes sociais como lentes para compreender a mídia social revela que muitas redes estão divididas em sub grupos divergentes entre si. As divisões são comuns na mídia social, o que faz com que a grande parte dos modos de análise metodológica mais comuns sejam perigosos. A análise de mídia social mais tradicional usa um processo baseado no modelo “saco de palavras” (bag-of-words), o qual parte do princípio em-
11
12
pírico impreciso de que um conjunto de mensagens conectadas forma uma unidade. Na realidade, geralmente são observados grupos diferentes. Unificar o conteúdo desses subgrupos distintos para análise é perigoso, mas métodos de análise de redes são resistentes a esses problemas. O método “saco de palavras” é particularmente passível se sofrer um efeito de “roda estridente” (squeaky wheel), no qual uma minoria vocal aumenta sua atividade o suficiente para criar uma impressão de que há uma mudança geral na opinião. Em contraste, os modelos de rede reconhecem que a opinião frequentemente é encontrada por grupos, com pessoas tendendo a conectar-se a outras com quem concordam, criando assim, grupos ou clusters emergentes. Nas redes de mídia social, os clusters são criados por homofilia. Do ponto de vista de rede, uma “roda estridente” parece com um grupo que falou mais alto, não com uma mudança de posição ou de opinião em outros clusters de opiniões. Modelos de rede para a opinião pública, assim, podem revelar que “o rabo abana o cachorro”. Historicamente, os métodos de rede têm sido de difícil acesso para muitas pessoas, mas a variedade de ferramentas está crescendo. Novatos no assunto hoje podem encontrar aplicativos que proporcionam análises sofisticadas de conexões anotadas. Como na história das tecnologias, como a editoração eletrônica, uma onda de ferramentas fáceis de usar está emergindo, empoderando um grande grupo de pessoas para que possam realizar análise de redes com um treinamento limitado. Conforme o acesso aos dados de rede e sua análise crescem, uma visão mais conectada do mundo está emergindo. A pesquisa que antes se satisfazia em descrever uma coleção
de “átomos” sociais agora busca compreender a estrutura das “moléculas” sociais. Essa mudança para a visão do mundo em rede é profunda. Os modelos baseados em indivíduos e seus atributos podem não conseguir ver o quadro todo. Quando conectamos os pontos no grafo social, as constelações de padrões que emergem são, ao mesmo tempo, belas e informativas. Da mesma forma que as primeiras tecnologias de imagem permitiram observar a estrutura interna do corpo humano ao vivo, as ferramentas de rede sociais estão revelando a complexidade estrutural interna dos grupos de relações sociais. Do mesmo modo que as tecnologias de imagem permitiram observar os confins do universo, as ferramentas de rede estão encontrando estruturas de larga escala que são comuns entre todas as sociedades humanas. Como muitos outros reinos na natureza, as redes sociais humanas geram uma diversidade de formas. Muitas redes variam em termos de densidade de conexões, algumas com menos conexões entre seus membros, outras, com muitas. Algumas redes têm divisões claras, com grupos separados que falam sobre a mesma coisa, mas não entre si, outras possuem comunidades densas, com um único grupo muito conectado. Algumas redes são centralizadas com um foco claro em torno de uma ou de várias pessoas. Essas redes que conectam a um núcleo central são comumente criadas por broadcasters ou serviços de suporte. Os mapas das conexões entre as pessoas que recentemente falaram sobre um produto, marca ou evento pode revelar posições-chave e clusters na multidão. Algumas pessoas, que falam mais sobre um tópico que está mais ao “centro” do grafo, podem ser influenciadores-
13
chave na população. A análise de redes faz com que seja uma tarefa simples classificar atores em uma população por sua localização na rede, para encontrar essas pessoas em posição central ou de “ponte” entre os grupos. Assim, muito ainda precisa ser pesquisado para que se possa compreender as relações entre as ferramentas de mídia social, seus usuários, seus eventos e as redes geradas nessas intersecções. Uma pesquisa recente da Pew Research Center’s Internet Project1 documentou seis tipos básicos de estruturas de mídia social presentes em plataformas como o Twitter. O seu relatório, “Mapeando as Redes em torno de Tópicos no Twitter: de Multidões polarizadas a clusters de comunidades”2 disponibiliza um guia sobre como analisar redes sociais para não programadores. Os métodos de rede desenvolveram-se significativamente nos últimos vinte anos, ao mesmo tempo em que as ferramentas de análise cresceram em poder e os dados a ser analisados cresceram em volume. Redes móveis, redes sociais e dispositivos sensoriais estão reconstruindo o mundo através de uma rede em tempo real, conectada. Conforme as sociedades humanas adotam tecnologias de rede, elas tornam visíveis suas estruturas existentes. E conforme usam e incorporam essas ferramentas, suas redes se modificam. Nosso desafio é documentar o que é revelado e compreender as forças que moldam essas novas formas. A análise de redes sociais e a mídia social são, assim, ferramentas críticas para pesquisadores e interes1 http://www.pewinternet.org/ 2 Mapping Twitter Topic Networks: From Polarized Crowds to Community Clusters - Disponível em: . Acesso em abril de 2015.
14
sados. Empresas, organizações, pesquisadores e movimentos precisam se tornar conscientes de suas próprias redes e do contexto geral de redes no qual se encontram. Assim, conforme essas redes emergem da névoa da metáfora, eles tornam-se cavalos de força dessa estrutura de dados, que documentam, explicam e auxiliam a predizer a natureza dessas sociedades. Os modelos de rede são perfeitos para estudar muitos dos processos sociais de interesse crítico. Da adoção de novos produtos e inovações ao surgimento de movimentos sociais, as redes efetivamente capturam as formas através das quais as populações conectadas operam. Indo além do fluxograma tradicional, utilizado em muitas grandes empresas e instituições, os mapas de rede são úteis para capturar, simplificar e explicar sistemas complexos grandes. Os métodos de rede, os dados, ferramentas e estudos estão agora abertos para pesquisadores de um largo conjunto de disciplinas. Pesquisadores nas áreas de sociologia, antropologia, educação, ciência política, jornalismo, comunicação, história, administração e outras disciplinas nas quais o conhecimento da área de programação é mais raro estão agora encontrando formas novas de aplicar a análise de rede para seus campos de estudo. Estudos de redes de patentes registradas em conjunto está, por exemplo, revelando “clusters de inovações” nas economias nacionais (Dempwolf, 2012)3. Estudiosos da antiguidade clássica estão descobrindo que textos gregos antigos podem ser vistos como uma fonte de informações sobre relações que podem ser estudadas como 3 Dempwolf, Christopher Scott. “Network models of regional innovation clusters and their impact on economic growth.” (2012).
15
redes (Cline, 2014)4. Do mesmo modo, observadores dos movimentos sociais estão estudando hashtags e o conflito de opiniões nos países com movimentos pró-democracia (Pearce, 2012)5. Essas redes não são apenas provenientes de mídia digital e de dados contemporâneos. Mas todos esses estudos têm, em seu núcleo, uma preocupação com a estrutura conectada. Essas observações e percepções são possíveis quando observamos o mundo como uma estrutura conectada, poderosa e nova em contraste com perspectivas mais individualistas. Hoje, ferramentas de rede como Gephi e NodeXL estão abrindo um mundo de redes para uma população crescente de pesquisadores e estudiosos, fazendo com que a forma do mundo social seja uma parte central de nossas discussões e documentações. O desafio permanece em fazer com que essas e outras ferramentas tornemse mais acessíveis e mais fáceis de usar. A “consciência” de rede permanece rara entre muitas comunidades de profissionais. Auxiliar as pessoas a “pensar em rede” e a considerar a forma da teia ao seu redor é uma tarefa difícil. A maioria dos sistemas de educação sequer menciona a palavra “rede”, o que dirá os principais conceitos e métodos da ciência das redes. O que antes era esotérico agora está provando que tem muitas aplicações práticas e comuns, com as redes tornando-se a estrutura de dados dominante no século XXI. As ferramentas de rede, assim, 4 Cline, Diane. The Social Network of Alexander the Great: Social Network Analysis in Ancient History. Disponível em: . Acesso em abril de 2015. 5 Pearce, Katy E, and Sarah Kendzior. “Networked authoritarianism and social media in Azerbaijan.” Journal of Communication 62.2 (2012): 283-298. 16
precisam ser melhoradas para apoiar o processo educacional, auxiliando a suportar o engajamento cognitivo das pessoas com o mundo das conexões. Ferramentas melhores estão emergindo enquanto novas tecnologias móveis, da web e computacionais estão fazendo com que novas aplicações sejam possíveis. Os métodos de rede são computacionalmente intensivos e os conjuntos de dados podem ser imensos. Hoje os recursos computacionais para analisar redes de larga escala estão tornando-se lugar comum e são mais econômicos. Em pouco tempo, computar dados “sociais” escaláveis será relativamente trivial. Conhecer e fazer o melhor uso desses dados não será, entretanto. A necessidade de consciência de rede não pode ser resolvida pela tecnologia apenas, a educação deveria abarcar os conceitos centrais de uma visão de rede do mundo. As redes são inerentemente sociológicas, claramente ilustrando as formas através das quais as pessoas estão envolvidas em teias de relações e instituições. Uma visão de rede convida a um tipo de experiência de aproximação que agora é comum através de ferramentas como o Google Maps. Uma visão mais ampla de uma região da vida social revela terrenos variados, auxiliando as pessoas a se localizar e a localizar suas instituições dentro de uma rede mais ampla. Mapas geográficos evoluíram através dos séculos para abarcar convenções de representação e interpretação. Nenhum mapa é totalmente “preciso”, mas muitos mapas são, entretanto, úteis. Os mapas de rede de terrenos sociais podem requerer tanto ou mais desenvolvimento de convenções, representações e interpretações quanto mapas da superfície da Terra. Mas como mapas geográficos, mapas sociais têm aplicações, desde encon-
17
trar pontos de interesse até as melhores rotas até eles. Os mapas sociais estão fazendo com que a vasta teia de conexões humanas seja tão mapeável quanto as redes de estradas e trânsito das cidades humanas. A história das aplicações desses mapas mostra que a documentação rápida do terreno social vai revelar surpresas e novas possibilidades. Muitas instituições dependem de mapas para definir jurisdições, identificar localidades estratégicas, planejar melhorias e otimizar os caminhos existentes. Conforme os desafios ao acesso e análise de dados de rede são superados, os mapas sociais, sem dúvida, terão aplicações similares. As perspectivas de rede levam a certas conclusões sobre o mundo. As redes mostram o quão interconectado tudo está. Uma visão de rede faz com que seja difícil imaginar que uma parte “ruim” do mundo não tenha efeitos para as demais partes. Tudo está conectado e uma visão mais emergente de mundo é necessária. * * *
18
Marc Smith possui bacharelado em Estudos Internacionais pela Drexel University, na Filadéflia, em 1988, mestrado em teoria social por Cambridge University (1990) e doutorado em Sociologia pela UCLA em 2001. É adjunct lecturer do College of Information Studies da University of Maryland. Smith é também um distinguished Visiting Scholar (pesquisador visitante) no Media-X Program da Stanford University. Atualmente, ele lidera o grupo de consultores Connected Action e dirige a Social Media Re-
search Foundation6 uma organização sem fins lucrativos devotada a ferramentas abertas, dados e pesquisa relacionada à mídia social. Entre seus trabalhos, estão: com Petter Kollock, o livro “Communities in Cyberspace” (Routledge) e com Derek Hansen e Ben Shneiderman, a obra “Analyzing Social Media Networks with NodeXL: Insights from a connected world” (Morgan-Kaufmann). * * * Contatos:
[email protected] http://www.connectedaction.net http://nodexl.codeplex.com http://twitter.com/marc_smith http://www.smrfoundation.org/
6 http://www.smrfoundation.org/ 19
Introdução Sobre Mídia Social Nos últimos anos, a expressiva disponibilidade de dados agregados pelas mediações tecnológicas tem despertado a atenção de pesquisadores e empresas de todo o mundo. Subitamente, o mundo passou a ser estudado como rede, onde os pesquisadores buscam padrões e elementos de conexão, dinâmicas e estruturas. O conceito de “rede”, conhecido há mais de um século, passa a ser trazido com força para o campo social, onde, através das novas mídias, novos rastros evidenciam esses padrões. Vértices passam a ser sinônimos de atores sociais e suas conexões são demarcadas como arestas. Uma das aplicações mais evidentes da Análise de Redes Sociais está, hoje, no estudo das redes sociais na internet. Nesta parte, discutiremos de forma breve os conceitos que vão nos auxiliar a compreender melhor a chamada “mídia social” como objeto. A mídia digital e, principalmente, os chamados “sites de rede social” (boyd & Ellison, 2007) passaram a desvelar rastros sociais com amplitude inédita. Esses sites, compreendidos como aquelas ferramentas que traduzem e complexificam as redes sociais para o espaço online, trouxeram aos cientistas sociais, pela primeira vez, a pos-
21
sibilidade de estudar as redes sociais, as interações e os discursos em larga escala. Além disso, essas ferramentas também proporcionaram o estabelecimento de espaços de representação, imbuídos da persona que representam e delimitados como um espaço “pessoal” de “fala” dos indivíduos, os quais se tornam passíveis de estudar pela primeira vez. Mas o que é mídia social? Como esta se relaciona com as redes sociais? Como podemos compreender a construção da esfera pública online? Como as ferramentas de rede social refletem os discursos que circulam na sociedade? Para começar a discussão, é preciso, primeiro, compreender o objeto ao qual este livro se refere. Assim, iniciaremos a discussão focando os elementos básicos que precisamos compreender para ir além e perceber a análise de redes sociais de forma aplicada, como é o nosso objetivo. É preciso, assim, clarificar o que compreendemos dentro de conceitos básicos de forma a construir a base da discussão da aplicação da perspectiva empírica. Nesta breve introdução, traremos alguns conceitos básicos que guiarão a aplicação da perspectiva da análise de redes para as redes sociais na internet.
Redes Sociais na Internet e Sites de Rede Social
22
Redes sociais e sites de redes sociais são conceitos diferentes. E, embora, no senso comum, ambos sejam usados como sinônimos, é preciso compreender que nem todo o site representa, efetivamente, uma rede social e nem toda a rede social está contida em um site.
As redes sociais são metáforas para a estrutura dos agrupamentos sociais. Elas são constituídas pelas relações entre os indivíduos e vão servir como estrutura fundamental para a sociedade. São, assim, uma forma de olhar os grupos sociais, onde se percebem as relações e os laços sociais como conexões, e os indivíduos como atores que estão unidos por essas conexões, formando o tecido social. As chamadas “redes sociais” na internet são traduções das redes sociais dos espaços offline dos indivíduos, de suas conexões sociais. No espaço online, essas redes sociais são demarcadas não só pelos rastros deixados pelos atores sociais e pelas suas produções, como também pelas suas representações. As redes sociais em sua representação no ciberespaço são um pouco diferentes das redes sociais no espaço offline. Primeiramente, porque as conversações e as trocas sociais deixam rastros no online (boyd, 2010, Recuero, 2012). Esses “rastros” são publicados, arquivados, portanto, são recuperáveis e buscáveis. Segundo, porque a própria representação do grupo social no ciberespaço altera o grupo em si. Essas redes são representadas principalmente através dos sites de rede social e de outras ferramentas que permitiram sua apropriação deste modo. As redes representadas nessas ferramentas, assim, sofrem menos com a temporalidade das relações offline. Não têm, por exemplo, seus laços desgastados pela falta de contato. Constituem-se em redes mais estáveis e, com isso, mais complexas, maiores e compreendendo uma pluralidade de relações mais ampla que aquela das redes offline. Ellison, Steinfeld & Lampe (2007), por exemplo, fizeram um estudo amplo indicando como o Facebook, en-
23
24
quanto suporte das relações sociais, modificou os processos sociais das pessoas, permitindo que atores que não tinham mais contato devido à distância pudessem investir ainda nesses laços sociais. No caso, o estudo mostrou que a ferramenta permitia aos atores a manutenção de uma rede social com a qual eles não teriam mais contato. Do mesmo modo, West, Lewis & Currie (2009) também têm um estudo parecido, discutindo como as “amizades” são vistas no universo do Facebook e nas esferas das relações públicas e privadas. Os sites de rede social não só publicizaram as conexões, mas também proporcionaram que os laços sociais (e as interações e relações) representados nos mapas se tornassem mais permanentes, menos fluidos, mais estáveis. É preciso que se diga, ainda, que o site não é a rede. Trata-se de um suporte, que é apropriado de diferentes formas pelos grupos sociais e cujos efeitos são construídos pelo complexo universo de negociação de normas e formas de interação. O trabalho de Malini & Antoun (2013) demonstra isso quando discute os movimentos que emergem das apropriações desses suportes, nas novas possibilidades de compartilhamento e cooperação que também são construídas pelas mudanças do digital. Esses exemplos trazem contribuições importantes a respeito das mudanças geradas pelos suportes nas redes sociais na internet. O estudo das redes é, portanto, o estudo dos padrões sociais. Como na Internet esses padrões se tornam mais evidentes, há a possibilidade de estudá-los de uma forma mais abrangente e em maior escala. É nisso que as medidas e perspectivas construídas pelo paradigma da ARS podem ajudar o pesquisador. E é também a partir daí que discutiremos a abordagem e suas contribuições para os estudos das redes.
As redes sociais na Internet representam um novo e complexo universo de fenômenos comunicativos, sociais e discursivos. Não porque a existência de “redes sociais” ou sua análise sejam algo novo, mas porque sua reinscrição no ciberespaço apresenta novos elementos e novas dinâmicas para seu estudo (Recuero, 2009; Benevenuto, 2010; Malini & Antoun, 2013). E essas dinâmicas tornam-se mais relevantes também com o advento dos sites de rede social (boyd & Ellison, 2007), que provêm um novo contexto para as redes, permitindo o registro de parte dessas dinâmicas sociais e seu acesso pelos pesquisadores. É tal registro que permite, pela primeira vez, que interações e conversações sejam mapeadas e estudadas em larga escala. Não sem surpresas, o foco renovado pela disponibilidade de dados empíricos trouxe novo fôlego para os estudos de redes sociais e suas apropriações no ciberespaço (vide, por exemplo, Amaral, 2010; Zago 2010; Zago & Rebs, 2011; Pereira & Araújo, 2013). O estudo das redes sociais na internet normalmente está associado aos sites de rede social. Ao lado de conteúdo gerado pelo usuário (user-generated content, UGC), sites de compras coletivas e jogos sociais, os sites de rede social aparecem como um tipo específico de mídia social (Van Dijck, 2013; Ellison & boyd, 2013). Embora alguns sites mesclem duas ou mais formas de mídia social (por exemplo, embora o foco do YouTube seja o conteúdo gerado pelo consumidor, ele possui recursos de sites de rede social; embora o Facebook seja primariamente um site de rede social, ele permite que o usuário gere e distribua conteúdos) – sites de rede social correspondem a um tipo específico de site voltado para a criação e manutenção de redes sociais.
25
Em 2007, boyd e Ellison (2007) definiram sites de rede social como espaços da web que permitem aos indivíduos criar um perfil, interagir através desse perfil, adicionar amigos e exibir a lista de conexões entre os amigos. Entretanto, nos últimos anos, alguns itens deixaram de ser fator de diferenciação (como lista de amigos, que aparece em outros tipos de mídias sociais), ao passo que outros elementos diferenciadores emergiram (como newsfeed, APIs, social graph, e outros). Assim, em 2013, as autoras atualizaram a definição para: Um site de rede social é uma plataforma de comunicação em rede na qual os participantes 1) possuem perfis de identificação única que consistem em conteúdos produzidos pelo usuário, conteúdos fornecidos por outros usuários, e/ou dados fornecidos pelo sistema; 2) podem articular publicamente conexões que podem ser vistas e cruzadas por outros; e 3) podem consumir, produzir e/ ou interagir com fluxos de conteúdo gerado por usuários fornecidos por suas conexões no site (Ellison & boyd, 2013, p. 158)7.
Essa nova definição marca uma mutação na forma de interagir com os sites de rede social. Se, nos primórdios dessa forma de comunicação, o foco estava nos perfis dos usuários, atualmente esse foco recai sobre os fluxos de conteúdo. Mais do que visitar o perfil alheio, os usuá7 Tradução nossa para: “A social network site is a networked communication platform in which participants 1) have uniquely identifiable profiles that consist of user-supplied content, content provided by other users, and/ or system-level data; 2) can publicly articulate connections that can be viewed and traversed by others; and 3) can consume, produce, and/ or interact with streams of user-generated content provided by their connections on the site”. 26
rios querem ver as atualizações mais recentes de seus contatos. Os próprios perfis mudaram para incluir, também, atualizações. De centrados nos perfis, os sites de rede social passaram a ser centrados na mídia (Ellison & boyd, 2013), o que faz com que sites de rede social sejam principalmente “uma plataforma de comunicação, além de destacar a importância do compartilhamento de conteúdo, geralmente consumido através de um stream” (Ellison & boyd, 2013, p. 159)8. Para as autoras, há uma diferença fundamental entre sites de rede social e formas tradicionais de mídia (rádio, TV): o que o usuário experiencia e o conteúdo a que é exposto varia para cada usuário, conforme a rede construída e os conteúdos compartilhados. “Isso é bem diferente de mídias anteriores como a televisão, na qual o programa não muda dependendo de quem pode vê-lo” (Ellison & boyd, 2013, p. 165)9.
Conceito de Mídia Social Imagine que você acabou de conectar em sua conta no Facebook. Como a maioria dos usuários, você vai ver primeiro o streaming (ou linha do tempo - que mostra os posts de seus amigos), ou seja, as informações publicadas pelas suas conexões. Ali, talvez você curta alguma foto de 8 Tradução nossa para: “as a communication platform, while also highlighting the importance of sharing content, typically consumed through a stream”. 9 Tradução nossa para: “This is quite unlike previous media like television, where the program does not change depending on who can see it”.
27
28
algum amigo, comente alguma coisa engraçada e talvez ainda decida compartilhar alguma postagem que achou especialmente inteligente de algum conhecido. Essas ações têm implicações diretas sobre o streaming que seus amigos vão ver da próxima vez que conectarem no site. Coisas que você comentou ou curtiu ou compartilhou vão ganhar mais visibilidade. Se suas conexões, ao ver essas informações a que você deu visibilidade por compartilhar, comentar ou curtir, decidirem fazer o mesmo, essa informação continua ativa na rede, sendo vista por mais gente, privilegiada pelo algoritmo do Facebook como algo relevante. E isso vai fazendo com que algumas informações tenham mais visibilidade e atenção e persistam existindo no ecossistema informativo do Facebook, e outras simplesmente sumam, sem nenhuma curtida, comentário ou compartilhamento. No Twitter, outro exemplo, a mesma coisa acontece. Quanto mais retweets um tweet recebe, mais visível ele se torna e mais retweets continua recebendo. É isso que os robôs (ou bots) fazem nessas ferramentas: procuram artificialmente inflar a quantidade de atenção de uma informação de modo a fazer crescer sua importância para a rede. Assim, o que é visto por cada usuário é, de certo modo, determinado pelas ações de centenas de milhares de nós da rede que viram/reproduziram ou não reproduziram essas informações antes dele. É esse complexo ecossistema que dizemos, neste livro, que constitui a chamada “mídia social”. É claro que chamar algo de «mídia social» envolve diretamente o conceito de mídia. A consolidação do conceito de media ou mídia foi gradual e progressiva. Hegel (1993) discutiu o conceito
longamente no quadro de seu sistema filosófico; Novalis (1826) relacionou medium e natureza; e Rilke (1976) vinculou o medium à obra de arte. Mas a trajetória filosófica e literária do vocábulo não incorporava a acepção comunicacional. Embora o conceito de medium já trouxesse uma mensagem antes mesmo da difusão global do conceito na década de 1960 do século XX (Hagen, 2008), foi durante a década de 1950 que o conceito de medium começou sua próspera carreira (Guillory, 2010). De acordo com Münker e Roesler (2008), um dos marcos históricos da ascensão do conceito ocorreu em 1964 quando Marshall McLuhan publicou Understanding Media, seu livro mais popular. Apesar de McLuhan descrever os media no primeiro capítulo com uma ampla gama de objetos, incluindo dinheiro, energia e munição, ele recua no segundo capítulo para uma definição de medium que inclui apenas rádio, televisão, telefone e os demais meios de comunicação de massa (Bastos, 2012). Embora essas questões sejam amplas e complexas, o tema deste livro não é o conceito de mídia. Bastanos, aqui, discutir o advento destas tecnologias de comunicação e sua apropriação como produtoras de um novo ecossistema de produção de conteúdo, cuja ação emergente dos atores dá ou não visibilidade a determinadas informações. O que chamamos mídia social se refere a um fenômeno emergente, que tem início com a apropriação dos sites de rede social pelos usuários. Essa apropriação, que horizontaliza ainda mais os processos de comunicação, dá outra força ao papel dos nós da rede. A visualização da rede, como metáfora, auxilia a compreender o papel dos nós. Na rede social e, em especial, nas redes
29
sociais no ciberespaço, cada conexão é um caminho, que permite que determinadas informações circulem entre os atores. Cada nó, portanto, quando recebe uma dada informação, pode decidir se a deseja replicar para sua rede ou não. Assim, cada nó tem uma posição específica na estrutura da rede e pode ou não repassar as informações que recebe para o restante de sua rede. Bruns (2003) tem um conceito que é aplicado para a circulação de notícias neste sentido, denominado “gatewatching” (em oposição a gatekeeping). O autor explica que, enquanto a prática de seleção do gatekeeping evoluiu da escassez de canais para veicular as notícias disponíveis, o gatewatching surge num contexto onde há pluralidade desses canais, não há preocupações com a redução de espaço disponível e há excesso de informações. Nesse contexto, o conceito de gatewatching foca as práticas semelhantes à curadoria e organização da informação (dos bibliotecários) e da filtragem de informações do gatekeeping. É esta a prática que Bruns credita aos jornalistas no espaço online. Entretanto, é uma prática também dos demais usuários que vai, através das ações de filtro, curadoria e criação de informações, compor a mídia social.
Públicos em Rede
30
Como dissemos, os sites de rede social como o Facebook permitiram que as redes sociais ficassem mais interconectadas (Backstrom et al., 2012), criando um espaço social público, ao mesmo tempo que dando outra dimensão ao conceito de esfera pública. Por isso, talvez o conceito
que melhor sintetiza essa mudança é aquele dos “públicos em rede” (boyd, 2010). A autora define o conceito como os públicos reestruturados na rede, o que compreende, ao mesmo tempo, o espaço construído pelas tecnologias e o coletivo que emerge da apropriação desse espaço. Por isso, os públicos em rede têm características relacionadas a esse espaço e suas apropriações. Dentre as características do espaço, estão: 1) a permanência das interações, ou seja, o fato de que as interações tendem a ficar inscritas na rede e ali permanecerem; 2) a “buscabilidade” dessas interações, que são recuperáveis; 3) a replicabilidade dessas interações que podem ser reproduzidas facilmente e; 4) a escalabilidade, ou seja, o potencial de alcance e multiplicação desses registros. Essas características mostram-nos que há uma mudança no suporte da interação, o que vai permitir que as informações que circulam nessas redes sejam difundidas de forma diferente. A possibilidade de replicar uma informação deve-se principalmente a sua permanência, ou seja, ao fato de que aquilo que é publicado permanece no ciberespaço, ou seja, é passível de ser visto e replicado. Porque pode ser replicado e permanece no ciberespaço, a informação torna-se mais visível a outros atores da rede (por exemplo, aqueles que não estavam online quando ela foi publicada originalmente), podendo ser escalada rapidamente. A “buscabilidade”, ou seja, a possibilidade de que a informação seja encontrada também contribui para a escalabilidade. Basicamente, isso significa que as conexões sociais que são construídas nos sites de rede social atuam de forma mais intensa e permanente do que aquelas que são offline. Além dessas características, os públicos em rede (boyd, 2010) também têm elementos relacionados à
31
apropriação. Essas características referem-se aos elementos que aproximam essas redes de públicos e não de espaços públicos, de acordo com a dualidade do conceito proposta por boyd (2010). São elas: (1) a presença de audiências invisíveis, ou seja, o fato de que as redes estão mais próximas, mas não são imediatamente discerníveis enquanto audiências desses espaços; (2) a confusão entre as fronteiras do espaço público e privado, onde elementos de uma esfera e de outra confundem-se cada vez mais; (3) o colapso dos contextos, ou seja, o fato de que as mensagens, por poderem ser reproduzidas e escaladas, podem também perder seus contextos originais, complicando o processo de comunicação. São esses elementos que permitem que a mídia social apareça como característica emergente dos processos de comunicação nos sites de rede social. A ação dos atores em propagar, replicar, dar visibilidade para determinada informação e não outra é que faz com que a mídia social emerja. É a reprodução e a contestação de discursos, o conflito das conversações e sua ampliação que vão dar a essas ferramentas a característica de mídia.
32
Mídia Social, Opinião e Esfera Pública Outra questão importante para as ideias defendidas neste livro é a percepção da mídia social como esfera pública. Para compreender esta ideia, é preciso, primeiro, recuperar a ideia de opinião pública. O conceito de opinião pública se divide em diversas correntes do pensamento ocidental. Em sua acepção mais próxima da comunicação (Lippmann, 1997), a opi-
nião pública é um fenômeno sócio-político que transcende o agregado de opiniões individuais e ideias presentes na população adulta. Embora o conceito atravesse diferentes tradições epistêmicas em comum, permanece a referência a um conjunto orgânico e complexo de opiniões que são percebidas de forma conjunta de modo a transcender a ocorrência individual de opiniões na sociedade. A ideia de “opinião pública” começou a ganhar aceitação no século XVIII com o crescimento da percepção de uma esfera pública centrada no Iluminismo na Europa. O termo em inglês é derivado do francês l’opinion publique, cunhado em 1588 por Michel de Montaigne (Lemert, 1981). Por conta dessa dependência conceitual, o desenvolvimento da ideia de “opinião pública” ocorre conjuntamente com a história da era moderna e o processo de urbanização da sociedade. De acordo com Fred Cutler (1999), foi Jeremy Bentham quem primeiro apresentou uma teoria sólida sobre a opinião pública. O filósofo inglês defendia que a opinião pública poderia pressionar os legisladores e assegurar que as leis seriam feitas para beneficiar a todos. O debate na Alemanha tem origens em Ferdinand Tönnies (1922), para quem a opinião pública (öffentlichen Meinung) teria a mesma função nas sociedades modernas que a religião teve nas comunidades pré-modernas. Jürgen Habermas atualizou a discussão sobre o conceito aproximando a opinião pública do debate sobre a “esfera pública” (Öffentlichkei). Para Habermas (1991), a esfera pública é um terreno universal, racional e desconectado das hierarquias sociais, onde a opinião pública é moldada. É esse terreno que permite à esfera pública atuar como um guia abstrato através do qual as ações políticas florescem (Benhabib, 1992, p. 87). O debate avançou ainda de
33
34
forma a abarcar a estrutura teórica da esfera pública, seus efeitos informacionais e os mecanismos de influência sobre a sociedade. A esfera pública (Öffentlichkeit), assim, é a infraestrutura relacionada a áreas abertas e democráticas de debate que produz opiniões políticas, como cafés, praças públicas, teatros ou locais de encontro gerais. A opinião pública, por outro lado, refere-se à modelagem de uma orientação política em dado momento, devido ao debate produzido na esfera pública. Desse modo, a esfera pública (Öffentlichkeit) e a opinião pública (öffentlichen Meinung) foram associadas a um período histórico específico quando, de acordo com Habermas (1991), uma nova sociedade emergia durante o século XVIII. Essas circunstâncias podem ser explicadas em função das necessidades comerciais criadas no período; contexto em que os bens materiais precisavam circular por diversos setores soiais para serem comercializados. Junto com os bens, notícias e questões de interesse geral poderiam ser trocadas e discutidas. A expansão na taxa de alfabetização das populações urbanas, a disponibilidade de livros e o estabelecimento de um jornalismo crítico separado das autoridades governamentais criou uma sociedade em contraposição com o estado absolutista, seja através da esfera pública, que era mais ampla que o poder governante, seja através da opinião pública, que não podia ser controlada pela estrutura eclesiástica. Luhman (1990), por sua vez, atualizou o debate uma vez mais e definiu a opinião pública como um paradoxo que representa o poder invisível do visível. Como resultado do desenvolvimento tecnológico da escrita que criava o público e, assim, a opinião pública- a opinião
pública não dependeria da opinião de indivíduos, de determinado julgamento social, ou do consentimento geral com relação a um determinado tópico. Ao invés disso, a opinião pública seria uma rede de comunicações de que ninguém é obrigado a tomar parte. Esta rede seria significantemente entrópica e qualquer ação com relação à opinião pública requerer um esforço substantivo dos sistemas sociais. Os sites de rede social, assim, podem ser compreendidos como elementos ampliadores da esfera pública que proporcionam um espaço onde, além da socialização, os atores podem expressar e reproduzir opiniões políticas, pensamentos e debate. Ao mesmo tempo em que mídia social seria um produto dessas conversações públicas, ela também atuaria de forma a moldá-las, interagindo com o sistema como um todo. Assim, os atores seriam influenciados pelas posições mais claramente explícitas e mais aparentemente apoiadas do que outras. A facilidade de reprodução das mensagens e de manifestação de apoio (curtindo ou retuitando, por exemplo) mensagens e escalabilidade das mensagens na mídia social poderiam, desse modo, influenciar essa opinião pública, produzi-la e ser produzidas por ela. * * *
Nessa breve introdução, trouxemos alguns conceitos essenciais para a discussão que faremos a seguir, aquela da aplicação da análise de redes sociais para a mídia social. Para tanto, explicitamos as características principais e o que compreendemos por mídia social. A seguir, iniciaremos a discussão já trazendo a análise de redes para a mídia social.
35
1 O que é Análise de Redes Sociais? Em 2012, um grupo de cientistas liderado por Lars Backstrom10 estudou como as pessoas estavam conectadas no Facebook. Um dos principais resultados do seu estudo foi que, entre um determinado usuário qualquer e outro (desconhecido) na rede, havia cerca de quatro pessoas em média. Isso significa dizer que, entre você e qualquer outro perfil no Facebook, há cerca de três conexões. Esta conclusão traz uma série de implicações para a sua vida cotidiana. Imaginemos, por exemplo, que você publicou uma foto de suas férias para seus amigos. Se um desses amigos, que chamaremos de João, decidir reproduzir sua foto para os amigos dele e um desses amigos de João, que chamaremos Luiz, também reproduzir sua foto, ela está virtualmente visível para todos os usuários do Facebook. Esse tipo de estudo, que se popularizou muito com o crescimento da adoção dos sites de rede social, foca a estrutura do tecido 10 Este estudo está disponível em: http://arxiv.org/pdf/1111.4570v3. pdf (Acesso em: dez. 2014). 37
social, de modo específico, essa estrutura online. O ponto fundamental do trabalho é que ele é baseado em um estudo semelhante realizado sobre os grupos sociais offline, por Stanley Milgram em 196711. O trabalho, denominado “the small world experiment”(o experimento do mundo pequeno) testou o quão conectadas estavam as pessoas e concluiu que a distância média de conexões entre os indivíduos no mundo seria de seis graus. Este trabalho deu origem a muitos outros testes semelhantes, que buscavam entender a estrutura dos grupos sociais (vide Newman, Barabási & Watts, 2006, por exemplo). Entretanto, a novidade do estudo do Facebook é ter mostrado que, no site de rede social, as pessoas estão muito mais conectadas do que os estudos anteriores mostraram. O foco na estrutura da sociedade não é algo novo. Conforme veremos nos próximos capítulos, é apenas uma forma de tentar compreender os grupos através de suas conexões, como as ações das pessoas as aproximam ou distanciam e os efeitos dessas ações. E de forma especial, isso parece ser particularmente relevante quando observamos os dados da mediação da internet, onde as pessoas podem estar bem mais conectadas conforme o estudo de Backstrom et al. (2012). Como as pessoas se conectam nos sites de rede social? Como as relações entre esses atores influenciam a propagação das informações por suas conexões? Como compreender essa maior conectividade apontada pelo exemplo que citamos no início? Essas questões todas têm em comum o foco na estrutura do grupo e nas influências dessa estrutura em processos de 11 Este trabalho está disponível em: http://snap.stanford.edu/class/ cs224w-readings/milgram67smallworld.pdf (Acesso em: jan. 2015). 38
difusão de informações e suas dinâmicas nos processos sociais. E este é, exatamente, o ponto central da Análise de Redes Sociais.
1.1 Definição O que chamamos de Análise de Redes Sociais (ARS) refere-se a uma abordagem de cunho estruturalista das relações entre os atores e sua função na constituição da sociedade. A ARS compreende assim um conjunto teórico e epistemológico focado na compreensão dessas estruturas sociais e seu papel. Em sua base metodológica, a ARS utiliza-se de um conjunto de métricas e técnicas de pesquisa utilizado para descrever a relação entre nós (atores, vértices) e suas conexões (arestas) (Degenne & Forsé, 1999; Hansen, Shneiderman & Smith, 2011; Scott, 2013; Wasserman & Faust, 1994). A constituição dessa abordagem tem diversos antecedentes e focos teóricos, que trabalharemos neste capítulo, com o objetivo de mostrar como se constituiu e como pode ser utilizada. O foco da ARS está no estudo da estrutura dos grupos sociais, buscando identificar as relações entre os atores dos grupos (Wasserman & Faust, 1994). Diferentemente da estatística convencional, a ARS se utiliza de dados relacionais ao invés de atributos individuais. Dados relacionais “são os contatos, laços e conexões, as ligações e pontos de contato do grupo, que relacionam um agente a outro e por isso não podem ser reduzidos às propriedades dos agentes individuais” (Scott, 2013, p. 3)12. Por 12 Tradução nossa para: “Relational data, on the other hand, concern the
39
conta desse foco relacional, Wasserman e Faust (1994, p. 5) reforçam que “a unidade de análise [da ARS] não é o indivíduo, mas uma entidade que consiste na coleção de indivíduos e as ligações entre eles”13. Assim, a ARS foca os estudos das conexões e dos atributos que essas conexões promovem. Um exemplo desses atributos é a capacidade que as conexões entre atores têm de servir como “vias” de informação. Assim, uma determinada informação (como por exemplo, uma ideia, um argumento ou propaganda) é propagada em um grupo através das conexões entre as pessoas. Estudos dessa linha buscam compreender como as conexões entre os diversos atores nas redes sociais online podem influenciar os processos de difusão de informações. (Vamos aprofundar mais esses elementos mais adiante neste livro. Mas um bom exemplo é o recente trabalho de Bakshy et. al. , 201214). A ARS, assim, faz parte de um paradigma de estudos denominado “análise estrutural” (Wellman & Berkowitz, 2007), cuja emergência como perspectiva distinta vem recebendo destaque, além de ter congregado estudiosos nos últimos anos. Dentro deste paradigma, o estudo das redes (network analysis) constitui-se em um conjunto de métodos (Degenne & Forsé, 1999) ou em uma “ferramenta intelectual” que auxilia a pensar as redes sociais em termos de nós e conexões (Wellman & Berkowtiz, 2007, contacts, ties and connections, and the group attachments and meetings that relate one agent to another and that cannot be reduced to the properties of the individual agents themselves”. 13 Tradução nossa para: “the unit of analysis in network analysis is not the individual, but an entity consisting of a collection of individuals and the linkages among them”. 14 Vide http://arxiv.org/abs/1201.4145 (Acesso em dez de 2014). 40
p. 4). Esse crescimento tem especial relevância quando aplicado aos estudos dos grupos sociais online, especialmente através dos chamados sites de rede social, conforme apontamos, e aos processos de agregação, difusão de informações e conversações estabelecidas na internet que discutiremos adiante. Entretanto, antes de iniciar este estudo com maior aprofundamento, é preciso inicialmente demarcar e historicizar a perspectiva da ARS, bem como seus principais conceitos e métricas, o que faremos a seguir neste capítulo.
1.2 Antecedentes da Análise de Redes Sociais Há uma série de perspectivas que vão inspirar e constituir a origem dos pressupostos teóricos da abordagem da análise de redes sociais. Neste subcapítulo, vamos discutir brevemente as principais perspectivas associadas e como estas inspiraram o surgimento da abordagem. Como sabemos, o surgimento de uma nova abordagem sempre é um fenômeno complexo cuja emergência é associada a uma série de fatores contextuais e históricos. Neste sentido, apontaremos alguns desses elementos contextuais. A abordagem de estudo das redes sociais nasce na esteira de uma série de estudos que buscavam superar o Cartesianismo, focando no estudo dos sistemas como o produto das interações entre suas partes. Assim, herdou do Sistemismo o foco na busca e compreensão dos padrões. Ao mesmo tempo, a Análise de Redes Sociais distancia-se desta abordagem pelo seu foco na chamada “análise estrutural”, que por sua vez tem suas
41
42
raízes no estrutural-funcionalismo. Assim, Scott (2001) vê entre teóricos da antropologia social, liderados por Radcliffe-Brown e seu conceito de “estrutura social” as raízes para a abordagem do conceito de «rede social». Ele explica que entre os anos 1930 e 1970, cada vez mais estudiosos passaram a usar, a partir do antropólogo, metáforas têxtis para a sociedade, focadas nas relações que eram interconectadas na sociedade (descrições como «teia social» ou «fábrica social»), culminando no conceito de rede, a partir do qual novos estudos surgiram (p.4-5). Entretanto, foi apenas no início dos anos 70 que os trabalhos mais «técnicos» passam a demarcar com mais força os principais conceitos que vão construir a Análise de Redes Sociais e, em especial, com um foco sociométrico. A análise estrutural, como paradigma de pesquisa, perpassa as mais variadas ciências, sempre com um foco na estrutura dos fenômenos. É especialmente no âmbito das ciências sociais que o foco é direcionado para a estrutura social e para as conexões existentes entre os atores sociais. Entretanto, como Freeman (2004, p.2) coloca, há relações sociais relevantes que não se dão necessariamente entre atores como indivíduos, mas no produto das relações entre os indivíduos que traz impacto para a sociedade. Isso traria o foco também para o estudo de outros fenômenos sociais (conforme argumentaremos no decorrer deste livro), cujo interesse está nos seus padrões relacionais. Freeman (2004) vê ainda a Análise de Redes Sociais como a principal abordagem da análise estrutural na sociologia e nos grupos sociais, que baseia suas premissas no estudo das interações sociais e nas formas de
conexão social, nos padrões dos laços sociais construídos pelos grupos. Para o autor, há quatro elementos que explicitam, mas não reduzem, a organização do paradigma para a pesquisa: (1) A análise de redes sociais é motivada por uma intuição estrutural baseada nos laços que conectam os atores sociais (2) Está fundamentada em dados empíricos sistemáticos
(3) Ampara-se fortemente em gráficos e imagens e
(4) Depende do uso de modelos computacionais ou matemáticos15 (Freeman, 2004, p.3)
É interessante observar, assim, que a ARS se dedica a construir interpretações a respeito de modelos de redes baseados em análises matemáticas, notadamente com um forte foco na visualização e na construção de mapas dessas representações. É relevante também observar o forte foco empírico, baseado em dados. Podemos, assim, explicitar que a análise de redes sociais constitui uma abordagem focada na análise da estrutura dos fenômenos, principalmente nas interrelações entre os atores. Assim, parte da origem da ARS estaria conectada aos estudos que trazem esse foco, como o trabalho de Simmel a respeito da estrutura social. 15 Tradução nossa para: “(1) social network analysis is motivated by a structural intuition based on ties linking social actors, (2) It is grounded in systematic empirical data, (3) it draws heavily on graphic imagery, and (4) it relies on the use of mathematical and/or computational models”. 43
Outras partes das origens remotas da ARS estariam nos estudos sociométricos de Moreno e Lewin, aliados a estudos recentes em diversas áreas (Scott & Carrington, 2011), além da teoria dos grafos, da qual decorre a representação e o mapeamento das redes na forma de nós, que representam os atores, ligados através de conexões (Wasserman & Faust, 1994). Examinaremos essas perspectivas e suas contribuições de forma mais detalhada a seguir. 1.2.1 Sociometria
44
As origens dos estudos relacionados à Sociometria geralmente são apontadas pelos estudiosos ao trabalho de Jacob Moreno. Moreno é o autor de um livro chamado “Who shall survive”, que em 1934 apontou os principais fundamentos do que posteriormente foi chamado “estudo sociométrico”. O trabalho de Moreno era baseado em uma teoria da sociedade em que os indivíduos formariam redes de conexões interpessoais, na qual ele não apenas fala em redes, mas nos efeitos dessas redes além dos indivíduos. Embora parte do seu trabalho seja referido por ele mesmo como “experimental”, ele buscou aplicar métodos quantitativos para o estudo desses grupos sociais, estudando, de forma específica, as cadeias de laços sociais entre os indivíduos e sua influência. Seu objetivo, portanto, era encontrar uma forma de “medir” os grupos sociais e extrair daí elementos para avaliá-los. Moreno tinha um importante foco empírico e este trabalho está bastante descrito nos seus livros. Freeman (2004, p. 39) explica que o trabalho de Moreno continha
“os quatro elementos que definem a análise de redes sociais contemporâneas”, a saber: Dados baseados nas escolhas dos laços sociais (quem está conectado a quem), a observação dos padrões de conexão entre os indivíduos, a análise dos tipos de conexões e os papéis sociais desses indivíduos. Foi Moreno também quem primeiro utilizou o sociograma, uma visualização gráfica das relações/conexões entre os indivíduos. O sociograma constitui-se em uma representação gráfica de rede, onde os nós ou vértices representam indivíduos e arestas ou arcos representam as conexões entre esses indivíduos. A visualização em forma de rede é normalmente baseada em uma matriz de relações, que também foi proposta por Moreno (vide Figura 1). 1.2.2 Teoria dos grafos
Um dos antecedentes mais importantes da Análise de Redes Sociais é a chamada Teoria dos Grafos, a qual tem suas raízes estabelecidas na matemática. Um grafo é a representação de uma matriz, onde os elementos (nós ou nodos) são apresentados como vértices e suas conexões (ou arcos) como arestas. A matriz corresponde ao conjunto de interrelações entre os diversos elementos que são representados pelo grafo (o que se aproxima bastante da proposta de Moreno para o sociograma, que é um grafo que representa um determinado grupo social). A figura a seguir mostra essa relação. A matriz pode ser construída a partir da representação da relação entre nós e suas conexões (nesse caso, cada par de nós em que há uma conexão é representado em uma
45
linha da planilha) (Figura 1), ou ainda através de uma matriz N x N, em que cada nó está representado numa linha e numa coluna da tabela, com a presença de conexão sendo representada pelo número 1 e a ausência de conexão pelo número 0 (Figura 2). Em ambos os casos, o grafo resultante será o mesmo.
Figura 1: Exemplo de matriz e grafo correspondente
Figura 2: Exemplo de matriz NxN
46
Easley & Kleinberg (2010) veem o estudo dos grafos como o estudo das estruturas de rede e a base para a compreensão das propriedades dessas redes. Os grafos são utilizados principalmente para a visualização das redes e suas propriedades, principalmente através de seus algoritmos e métricas.
Se a perspectiva da sociometria e a análise estrutural consistem nas bases mais “sociológicas” da ARS, é na Teoria dos Grafos que reside o fundamento das métricas e algoritmos utilizados para calcular elementos da rede, bem como para construir essas redes. Assim, a representação de uma rede que é construída sobre um algoritmo é, geralmente, denominada “grafo”. A teoria dos grafos tem suas raízes no trabalho do matemático Leonhard Euler, cuja obra, profícua, gerou inúmeras contribuições para variados campos. Euler resolveu, em 1736, o famoso enigma das pontes de Königsberg. A cidade, construída parcialmente sobre duas ilhas, era toda interconectada por várias pontes. O problema consistia em verificar se era possível atravessar todas as pontes apenas uma vez, saindo e retornando ao mesmo ponto. Euler provou que não era possível, criando o primeiro teorema da teoria dos grafos. O autor transformou as pontes em conexões e a cidade (e suas partes) em nós. Como cada nó precisava de duas conexões (uma vez que era preciso uma para entrar e uma para sair), cruzar as sete pontes apenas uma vez só seria possível caso o número de arestas fosse par. Como era ímpar, o resultado era a impossibilidade. Na Figura 3 é possível observar a localização das pontes no mapa da cidade (à esquerda) e o grafo resultante das possibilidades de travessia (à direita). No grafo, as porções de terra são representadas por nós e as pontes entre elas são as conexões.
47
Figura 3: Pontes de Königsberg Fonte: http://en.wikipedia.org/wiki/Seven_Bridges_of_Königsberg
A teoria dos grafos, assim, foca na representação de fenômenos como grafos e nas propriedades que podem ser extraídas desses grafos. Vamos discutir algumas destas propriedades a seguir, com suas aplicações para as análises computacionais de redes sociais na internet, que são o objeto deste livro. Grafos podem ser simétricos e não simétricos (também referidos como direcionados ou não direcionados), ou seja, representar relações mais ou menos igualitárias. Essa assimetria é dada pelo direcionamento da conexão de um nó a outro. Assim, uma relação assimétrica é aquela onde a conexão entre um determinado nó A e um determinado nó B não é igual, como por exemplo A->B ou B->A. Em ambos os casos, apenas um nó faz a conexão enquanto o outro nó a recebe. Uma conexão simétrica, assim, seria AB, ou seja, onde tanto A quanto B fazem e recebem a conexão. Grafos simétricos são também chamados grafos não direcionados e grafos assimétricos, grafos direcionados. Também é possível encontrar grafos mistos, ou seja, aqueles em que as conexões podem ser, ao mesmo tempo, simétricas e assimétricas. Em geral, grafos simétricos são aqueles onde o direcionamento na conexão não importa, por exemplo, uma estrada que co48
necte duas cidades. É irrelevante a direção da estrada, bastando, para sua representação, que conecte os dois pontos. Já grafos assimétricos são aqueles onde o direcionamento da conexão é relevante, por exemplo, uma representação de uma rede de esgoto pluvial. Os grafos também podem ser ponderados, ou seja, ser constituídos de arestas que possuem um peso determinado diferente entre si. Isso significa que uma conexão A->B pode ser diferente de uma conexão B->A, na medida em que cada aresta tem um peso diferente. Imaginemos um exemplo: uma rede constituída dos diversos aeroportos do Brasil, onde os nós são os aeroportos, e as conexões, as diversas linhas que conectam esses aeroportos através de voos. Sabemos que o Brasil possui aeroportos que são mais populares do que outros, ou seja, aeroportos onde mais voos chegam e saem do que outros, por inúmeras razões. Assim, uma conexão entre dois aeroportos muito populares, por exemplo, na ponte aérea Rio-São Paulo, vai ter uma quantidade maior de voos do que outras menos populares, por exemplo, uma conexão entre uma cidade do interior e São Paulo. Assim, poderíamos imaginar que a conexão Ribeirão Preto-São Paulo tem um peso menor (menos voos) do que a conexão São Paulo-Rio de Janeiro. Além disso, o número de voos de ida pode ser também diferente do número de voos de volta por dia, o que também alteraria o peso das conexões em nosso grafo. Outra definição importante, dentro da teoria dos grafos, é aquela de “caminho”. Um caminho é a conexão entre dois nós. É relevante pensar essa conexão como “caminho”, na medida em que, explicam Easley & Kleinberg (2010, p. 26), “coisas frequentemente trafegam entre as
49
várias arestas de um grafo”16. Essas conexões, assim, não são meras conexões, mas modos de circulação. Em termos de rede social, essa noção de que elementos circulam pelas arestas é muito importante. Em grupos sociais, coisas diferentes circulam pelas conexões entre as pessoas. Assim, por exemplo, uma conexão entre duas pessoas é caminho para a circulação de informações, a negociação de valores específicos (como capital social, conforme veremos), a negociação de influência e etc. O estudo da «distância social» do Facebook, de Backstrom e seus colegas, com o qual abrimos este capítulo, é um exemplo de trabalho que leva em conta a distância social entre dois atores na rede para compreender essa influência na difusão de informações. É um estudo que objetivou compreender melhor também a estrutura da rede. Um dos pontos mais importantes que precisa ser compreendido a respeito dos grafos é seu papel como representação. Como representação de um sistema complexo como uma sociedade, o grafo é frequentemente uma fotografia da estrutura em um dado momento e não um filme da mesma. Assim, é preciso ter em mente que dificilmente uma representação estática dá conta da complexidade de um sistema social. Essa é uma crítica frequente feita à análise de redes sociais como um todo (Watts, 2003). Entretanto, Borgatti, Brass e Halgi (2014) discutem essa crítica dizendo que há trabalhos com foco longitudinal, que levam em conta a questão da dinâmica dessas redes, seus fluxos e sua evolução no tempo. Talvez aqui, a resposta seja que a ARS traz “retratos” de momen16 Tradução nossa para: “things often travel across the edges of a graph”. 50
tos específicos da rede, que podem e devem, de acordo com o objeto e a questão de pesquisa, ser contrapostos com outras fotografias, mostrando a evolução e as mudanças da rede no tempo. ***
Neste primeiro capítulo, buscamos reconstruir de forma breve o histórico dos estudos de análise de redes, de forma a situar o leitor nas bases da abordagem. Vimos, assim, os principais antecedentes da abordagem, o que ela é e como se constitui e uma breve introdução a alguns conceitos. A partir do próximo capítulo, discutiremos de forma mais aprofundada esses elementos e conceitos e sua aplicação.
51
52
2 ARS: Principais Elementos
A abordagem da Análise de Rede Social constituise a partir de uma série de elementos básicos e seu referencial, o que discutiremos neste capítulo. É importante ressaltar que boa parte desses elementos é proveniente da teoria dos grafos e na sociometria, portanto, também usados nos estudos que envolvem grafos em geral como representações de grupos sociais. A ARS preocupa-se assim com um tipo especial de dado: o dado relacional. O que se quer compreender são as relações entre os elementos. De acordo com Scott (2001), essas relações não são “propriedades dos agentes, mas do sistema de agentes” (p.3)17. Neste livro, nosso objeto são as redes sociais na internet, de modo especial, a partir dos dados de sites de rede social. Por conta disso, traremos já esses elementos para dentro desta perspectiva. Dissemos que uma rede é composta de nós e suas conexões. No caso de uma rede social, essa rede representa um conjunto de atores sociais e suas conexões sociais 17 Tradução nossa para: “Relations are not the properties of agents, but of systems of agents”.
53
(que podem ser constituídas por interações, laços e capital social). No caso das redes sociais na Internet, essas representações focam estruturas sociais que são exibidas no espaço online, seja em sites de rede social ou em outras ferramentas onde pessoas possam criar representações e interagir. O que se objetiva conhecer, assim, não é quem são os atores, mas como se estruturam suas conexões e como essas conexões atuam no grupo como um todo no ciberespaço. Nesse sentido, há várias redes possíveis de ser mapeadas e analisadas.
2.1 Nós e Arestas
54
Um ator, em análise de redes sociais, refere-se ao indivíduo ou coletivo de indivíduos considerados como nós da rede. Freeman (2004) afirma que as representações dos atores na rede também podem ser constituídas pelos produtos da interação entre os indivíduos, além de grupos e organizações. O nó da rede, assim, é uma representação dos atores da rede social escolhida. No caso da análise de redes sociais na internet, os nós são representações dos atores, tais como perfis e nicknames, textos, posts publicados (no sentido das representações da interação de Freeman) e etc. O ator será representado pelo vértice ou aresta do grafo. Há todo o tipo de conexão entre os atores nas redes sociais, notadamente aquelas relacionadas aos laços sociais e à emergência de capital social. Essas conexões são representadas pelas arestas entre os nós e referem-se aos elementos de conexão que são decididos e apontados pelo pesquisador.
Em termos de redes sociais na Internet, as conexões podem representar interações, como no Twitter. Uma rede no Twitter, assim, pode mostrar quais atores (contas individuais) falam com e sobre quais atores. Assim, as conexões são marcadas pelas menções (quem cita quem ou responde quem) e pelos retweets (quem repassa a informação de quem). Entretanto, as conexões também poderiam ser demarcadas por quem segue quem, ou seja, quem estabelece uma conexão com quem. Há, assim, duas formas de estabelecer quais serão as conexões analisadas. Essas são redes diferentes e com características diferentes, as chamadas redes associativas e emergentes (Recuero & Zago, 2009). Enquanto as redes associativas são aquelas que dependem de uma relação de associação (por exemplo, adicionar um amigo no Facebook), as redes emergentes referem-se àquelas que estão construídas sobre a interação (por exemplo, a rede de comentários de um determinado post no Facebook). Assim, é preciso também determinar qual rede e quais tipos de conexão serão analisados. Conexões também podem ter valores diferentes, conforme dissemos antes. Isso significa que é possível atribuir um peso para cada conexão, como por exemplo, o número de interações entre duas contas no Twitter. Imaginemos que A enviou 5 tweets para B. Portanto, o valor da conexão representada no grafo é 5. Mas A enviou apenas 2 tweets para C, portanto, a conexão entre A e C será mais fraca. Em termos sociológicos, essa ideia vai ao encontro da proposta de Granovetter (1973) sobre os chamados laços “fortes” (aqueles que são constituídos e apresentam maior intimidade e confiança, através do acúmulo de in-
55
terações e relações sociais) e os “fracos” (constituídos de menos valores e menos interações). Conexões mais sedimentadas tendem a acumular maior número de relações, e conexões menos sedimentadas, um número menor. Everett & Borgatti (2014) também discutem o papel dos chamados “laços negativos”, ou seja, aqueles que são antagonísticos por natureza (as relações conflituosas entre as pessoas, como sentimentos e comportamentos negativos). Para os autores, esses laços se diferenciam daqueles que são positivos (por exemplo, relações de amizade), mas com consequências negativas (através dessas relações se difunde um boato, por exemplo). Essa classificação atenta para a diferente qualidade dos laços de forma mais contundente e explicita que essas relações negativas também podem ser exploradas através da análise de redes, embora a interpretação da rede, neste caso, dar-se-á de forma diferente (Everett & Borgatti, 2014).
2.2 Grupo Um grupo é uma “coleção de todos os atores nos quais os laços serão medidos” (Wasserman & Faust, 1994, p. 19)18. O grupo, na análise de rede social, pode ser constituído da rede como um todo ou constituir-se em um dos vários agregados de nós que normalmente são observados nessas medidas. Um grupo pode ser, assim, compreendido como um cluster de nós. O cluster é compreendido como um agregado mais denso que o restan18 Tradução nossa para: “a group is a collection of all actors on which ties are to be measured”.
56
te da rede, ou seja, um conjunto de nós aproximados por um maior número de conexões ou por conexões mais pesadas na rede. Em geral, um mesmo grafo pode ter um ou vários clusters. Há várias formas de se visualizar grupos diferentes nas redes sociais. Veremos mais sobre isso no capítulo sobre métricas. Mas é importante que saibamos que um grupo pode representar várias coisas, desde um agregado de nós que está mais junto por alguma conversa, ou mesmo um agregado de nós que está articulado durante uma ação.
2.3 Capital Social Outro elemento relevante para o estudo das redes sociais é o conceito de capital social. O capital social é, basicamente, o tipo de valor que é constituído pelos atores, durante as interações. Trata-se de um conceito metafórico, que foca as vantagens para determinados atores de sua posição na estrutura social. Embora seu conceito e aplicação sejam variados (Wellman, 2001), é um elemento de análise fundamental nas redes sociais. Burt (1992) é um dos pesquisadores que procurou compreender a influência do capital social na estrutura das redes sociais criando o conceito de “buraco estrutural”19. O autor discute as vantagens de um ator que funciona como “ponte” entre vários grupos não conectados (poderíamos dizer, que tem grau de interme19 Este conceito será trabalhado mais adiante neste capítulo com maior profundidade.
57
58
diação – betweenness – alto) quando esse ator está em um ambiente externo, ou seja, fora dos grupos (ou entre eles), especialmente em situações de competição ou conflito (Lemieux & Oimet, 2004). Assim, por exemplo, imaginemos que João frequenta uma academia para fazer exercícios e que, nesse grupo, conhece várias pessoas (como Maria, Ana e Juliano). João também frequenta um clube de xadrez, onde tem amigos como Lúcio, Andrea e Joana. Como desses dois grupos João é o único a frequentar os dois ambientes, ele é uma “ponte” entre o clube de xadrez e a academia, alguém que pode circular informações de um grupo para o outro. Agora vamos pegar outro ator, Júlio. Júlio frequenta um único grupo, o de seus amigos da faculdade. Imaginemos, agora, que João está competindo com Júlio por uma vaga de trabalho. João tem maiores possibilidades de conseguir uma recomendação por alguém de seu grupo que conheça alguém relacionado à seleção do que Júlio, simplesmente porque conhece mais gente, que, por sua vez, conhece mais gente. Ele está melhor conectado do que Júlio. Tem mais capital social do que Júlio. O valor desse grau de intermediação (ou buraco estrutural) no ambiente interno a uma rede, por outro lado, seria prejudicial, pois “isola” o ator. Trata-se, assim, de um estudo sobre o valor das conexões no grupo e sua influência, portanto, capital social. Os tipos de capital social constituídos na estrutura das redes também já foram trabalhados de forma bastante ampla por diversos autores. Não há um conceito homogêneo, no entanto. Para alguns autores, o capital social está constituído na estrutura social pelos atores (Coleman, 1988). Para outros, é um recurso mais abstrato, que é disponibilizado pela rede (Bourdieu, 1983). As diferen-
ças dos conceitos estão relacionadas ao modos de investimento e constituição dos recursos e, depois, aos modos de usufruto desses recursos (Lin, 2001). Como o capital social pode ser usufruído de forma individual ou coletiva, ele pode, através de algumas formas, constituir benefícios para a rede (o grupo como um todo) e de outras formas, constituir benefícios para o indivíduo. Assim, Lin (2001) e Burt (1992), por exemplo, afirmam que se trata de um bem que é, ao mesmo tempo, público e privado. O capital social é, dessa forma, intrinsecamente associado ao estudo das redes sociais e dos laços sociais. Entretanto, pode adquirir formas diferentes nas redes sociais online. Há vários estudos focando o conceito de capital social nas redes sociais online, notadamente os de Ellison, Steinfeld & Lampe (2007), Steinfeld, Ellison & Lampe (2008) e os trabalhos de Wellman e seu grupo (Hamptom & Wellman, 2003 e Wellman, Quan Haase, Witte e Hampton, 2001, por exemplo). De uma certa forma, a mudança gerada pelos sites de rede social nas redes sociais offline tem efeitos, assim, nos tipos de valores que são criados e usufruídos pelas redes online. Os efeitos dessas redes na construção e no usufruto de valores e os efeitos desses valores nas redes, em retorno, constituem-se um dos principais focos do estudo do conceito na análise de redes.
2.4 Rede Inteira e Rede Egocentrada Outro conceito importante é aquele de rede egocentrada ou rede inteira. No caso, o conceito é relativo à forma através da qual se coletam os dados. A rede egocentrada é aquela que é baseada em um determinado nó
59
60
(chamado ego), a partir do qual os dados são coletados e que provavelmente estará situado mais ao centro do grafo. Assim, trata-se de uma rede onde os dados são coletados a partir de um determinado ator A (coletam-se suas conexões e as conexões de suas conexões, por exemplo). A limitação da coleta, neste caso, está na distância geodésica de ego. Assim, a coleta de uma rede ego pode acontecer dentro de uma distância de um grau (ego e conexões de ego), 1,5 grau (ego, conexões de ego e conexões entre conexões de ego), dois graus (ego, conexões de ego e conexões de conexões de ago) etc. Nesses casos, ego será sempre o centro da rede. No exemplo a seguir (Figura 4), vemos uma rede egocentrada. A figura, capturada a partir das menções à conta oficial de Dilma Rousseff no Twitter, mostra a rede construída em torno de ego (no caso, a conta em torno da qual os dados foram capturados). Há outras formas de coletar, como por exemplo, quando há o foco em um determinado grupo. Assim, coletam-se os nós e suas relações dentro do grupo, cuja fronteira é estabelecida pelo grupo em si (por exemplo, um grupo no Facebook ou a coleta de dados de uma hashtag no Twitter). Nesses casos, todas as conexões e os nós que estão incluídos no grupo são coletadas. É uma abordagem que gera menos centralização da rede e, por isso, permite que se observe melhor como o grupo coletado está estruturado. É a coleta de “rede inteira”. Na Figura 3, temos um exemplo desse tipo de coleta. A mesma foi realizada por uma hashtag, referente a um jogo da Copa do Mundo de 2014. A hashtag em questão era a #belvsusa, e representa parte das conversações em torno do jogo Bélgica x Estados Unidos.
Figura 4: Exemplo de rede egocentrada (ego ao centro).
É interessante observar como há uma centralização muito maior na Figura 4 (o que é de se esperar quando o ego está presente na rede, pela forma de coleta) do que na Figura 5 (onde há maior pluralidade de centros). Isso significa que a forma de coletar os dados pode influenciar a rede que se está analisando.
Figure 5: Rede inteira. Observe-se a ausência de um único nó central.
61
2.5 Rede de Dois Modos ou Bipartidas As redes de um modo são aquelas onde os nós e as conexões são semelhantes ou pertencem à mesma ordem. Por exemplo, imaginemos uma rede construída a pWWartir dos amigos de um determinado indivíduo no Facebook. Os nós aqui são os perfis que representam os amigos; e as conexões, o fato de serem ou não amigos entre si. Trata-se de uma rede de um modo, onde todos os nós (perfis) e todas as conexões (conexão entre os perfis) são semelhantes. Numa rede de dois modos, temos nós ou conexões pertencentes a ordens diferentes. Borgatti explica, assim, que “modo” se refere à “classe das entidades analisadas (atores, vértices, ou nós)20”(p.2, 2008).Assim, uma rede de dois modos compreenderia, por exemplo, conexões do indivíduo com outros indivíduos ou com fanpages, no mesmo exemplo. Borgatti (2008, p. 2) define redes de dois modos explicando que “em análise de redes sociais, dados de dois modos referem-se a dados que registram conexões entre dois tipos de entidades”21. É o caso, em outro exemplo, do mapeamento de uma rede em uma fanpage no Facebook. Os nós, aqui, poderiam ser posts ou contas individuais que estão conectados entre si por comentários ou curtidas. Tratase, assim, de uma rede que representa conjuntos de nós 20 Tradução nossa. No original: “In this context, the term ‘mode’ refers to a class of entities – typically called actors, nodes or vertices – whose members have social ties with other members (in the 1-mode case) or with members of another class (in the 2-mode case)”. 21 Tradução nossa. No original: “In social network analysis, 2-mode data refers to data recording ties between two sets of entities”.
62
diferentes. Ambos os nós podem estar representados no grafo (veja a figura a seguir - Figura 6). Na Figura 6, vemos a rede de três posts da fanpage da Wikipedia no Facebook. Os grupos referem-se aos comentaristas e curtidores de cada post (que formam um pequeno grupo em torno do post, que também aparece como um nó na rede). É importante salientar que a análise de redes de dois modos é extremamente complexa, pois boa parte das medidas usadas para compreender as redes funciona apenas para redes de um modo. Assim, muitas vezes é preciso transformar essas redes (por exemplo, analisá-las como dois conjuntos de dados separados) para se obter um melhor resultado. É possível, também, analisar redes bimodais através de análise unimodal, ou seja, de um modo para cada variável.
Figura 6: Rede de dois modos. Posts e comentários/curtidas da página da Wikipedia no Facebook.
63
2.6 Grafos direcionados e não direcionados
64
A teoria dos grafos consiste em uma representação da relação entre nós em uma rede que pode apresentar dois tipos de conexões ou arestas: direcional ou não direcional. Os grafos são representados de uma maneira esquemática em que os pontos são conectados entre si por linhas ou curvas. Quando o grafo é direcionado, as linhas ou curvas apresentam uma flecha indicando a direção da conexão. Quando o grafo é não direcionado, há apenas uma linha ou curva conectando os dois nós. Um exemplo claro de rede social direcional é o Twitter, onde o usuário A pode seguir o usuário B sem que o usuário B siga o usuário A. Com isso, há uma relação direcional entre o usuário (ou nó) A para o usuário B, mas não do usuário B para o A. O Facebook, por sua vez, descreve perfeitamente uma rede social não direcionada, uma vez que a aceitação de um convite para amizade no Facebook imediatamente conecta dois usuários sem qualquer direcionalidade na relação de amizade. Outro exemplo ilustrativo é a representação dos convidados que participaram de uma festa em um grafo. Nesse caso, é possível estabelecer uma conexão entre todos os convidados em um grafo não direcionado e comparar essa rede com grafos subsequentes baseados em convidados de outras festas. Outra possibilidade é analisar apenas os convidados que conversaram entre si durante a festa. Nesse último caso, a rede passa a ser direcional se considerarmos quem iniciou a conversa, ou não direcional se estivermos interessados apenas nos pares que interagiram durante o evento. Redes direcionais podem sempre ser convertidas em redes não direcionais, sob o
risco de descarte de informações importantes. Redes não direcionais, por outro lado, são simétricas e não podem ser convertidas para redes direcionais. Apesar dessa definição dicotômica entre grafos direcionados e não direcionados, é possível a definição de diferentes tipos de conexões (diretas e indiretas) dentro de uma mesma rede, cujo resultado é um grafo misto. De todo modo, a definição do grafo como uma rede direcional ou não direcional tem implicação direta no cálculo das métricas da rede, uma vez que a direcionalidade das conexões implica em um número potencial de conexões maior (com indegree e outdegree) em comparação com o número potencial estabelecido em uma rede não direcional (onde há apenas degree). Para as redes não direcionais, o número máximo de conexões possíveis (sem self -loops) é expresso da seguinte forma: n(n - 1)/2.
2.7 Métricas de ARS A análise de redes sociais é baseada em métricas específicas, construídas através dos anos por vários pesquisadores e trabalhos. Essas métricas estão geralmente relacionadas ao nó e sua posição na rede ou à rede como um todo. A seguir, passaremos a explorar algumas das principais métricas utilizadas por analistas de rede e discutiremos suas aplicações na mídia social. É importante ressaltar que as métricas estão em permanente construção e reconstrução, especialmente dado o interesse na ARS nos últimos anos. Assim, novos trabalhos discutindo novas métricas e novas formas de analisar estão constantemente aparecendo, e as métricas são criadas e aprimoradas o tempo todo.
65
2.7.1 Métricas de Nó
As métricas típicas do nó referem-se, principalmente, a sua centralidade, ou seja, ao quão central é um determinado nó em uma determinada rede (Scott, 2004; Degenne & Forsé, 1999; Wasserman & Faust, 1994). Essas métricas são calculadas para todos os nós da rede e precisam ser observadas em relação umas com as outras. São normalmente referidas como métricas de centralidade e, entre essas, iremos abordar cinco principais: grau do nó, grau de intermediação, grau de proximidade, centralidade de autovetor e PageRank. 2.7.1.1 Grau do Nó
66
Essa é a primeira medida do que se entende como centralidade nos grafos. Ela representa o número de conexões que um determinado nó possui. Quanto mais conexões, mais central o nó é para a rede (Scott, 2001). Um grafo direcionado tem dois tipos de grau: O indegree, ou grau de entrada, que representa a quantidade de conexões que um determinado nó recebe e o outdegree, ou grau de saída, que representa a quantidade de conexões que o nó faz. Conexões recebidas podem ser, assim, por exemplo, citações a uma determinada conta no Twitter. São conexões direcionadas, pois A cita B. Logo o indegree de B (que recebeu a conexão) aumenta. Por outro lado, aumenta também o outdegree de A (que fez a conexão). Em grafos não direcionados, há apenas uma medida: o grau. Quando observamos uma rede de amigos no Facebook, por exemplo, as conexões são não direcionadas. Ou existem ou não existem, não têm uma direção. A rede, portanto, não pode ser expressa em termos de indegree
ou outdegree. A centralidade em termos de grau é uma centralidade denominada local, pois se refere ao nó em relação ao seu grupo mais próximo. Os graus de um determinado nó variam entre 0 e o número máximo de conexões possíveis. No exemplo a seguir, observamos a rede de tweets em torno de uma hashtag “#vacinahpv” que fez parte de uma campanha do Ministério da Saúde pela vacinação de mulheres e jovens no Brasil, em 2014. No exemplo da Figura 7, vemos um grafo delimitado a partir do indegree. Nós maiores são aqueles com um maior indegree. O nó com maior indegree, ao centro, é a conta oficial do Ministério da Saúde, @minsaude. Isso significa que ele foi a conta mais citada quando os usuários do Twitter repassaram a mensagem. No exemplo da Figura 8, temos o mesmo grafo, mas desta vez demarcado por outdegree. Neste caso, observamos que a conta oficial do Ministério continua central. Entretanto, outros usuários que têm um menor número de citações passam a aparecer mais, porque repassaram mais mensagens utilizando a hashtag. É interessante observar como a centralidade da rede é alterada nos dois casos assim como os diferentes dados que temos a partir da observação de cada uma.
67
Figura 7: Grafo da #vacinahpv com indegree correspondente ao tamanho dos nós.
Figura 8: Grafo em torno da #vacinahpv com outdegree correspondente ao tamanho dos nós.
68
2.7.1.2 Grau de Intermediação (Betweenness)
O grau de intermediação é outra medida de centralidade. Entretanto, ele mede o quão “entre” grupos no grafo um determinado nó está, ou o número de vezes em que o nó é “ponte” entre vários grupos de nós. Assim essa medida nos mostra quais nós são mais relevantes para conectar diferentes grupos. Essa proposta foi inicialmente formulada por Freeman (1979). Originalmente, Freeman definiu essa centralidade apenas para grafos indiretos. White e Borgatti (1994), entretanto, discutiram a possibilidade de se utilizar essa métrica para grafos direcionados (assimétricos), trabalhando com uma medida que chamaram de centralidade betweenness relativa. Newmann (2003) explica que a centralidade betweenness pode ser uma métrica de «influência que um determinado nó tem no espalhamento de informação na rede”22, uma vez que, quanto mais “ponte” um nó é, mais relevante é sua função de gatekeeper na decisão de quais informações circulam entre os diferentes grupos. Um nó com uma grande centralidade betweenness, assim, conecta vários grupos diferentes, que não estariam tão interconectados se esse nó não existisse. Essas pontes também são responsáveis pela redução da distância social na rede, aproximando grupos diferentes. As pontes também são relevantes para conectar diferentes clusters e reduzir as distâncias dentro do grafo.
22 Tradução nossa. No original: “the influence a node has over the spread of information through the network”. 69
Figura 9: Grafo em torno das #eleicoes2014 com betweenness correspondente ao tamanho dos nós no grafo.
No exemplo (Figura 9), vemos a rede em torno da hashtag #eleicoes2014, recolhida no dia do primeiro turno (06 de outubro), ao meio dia23. A rede tem os nós maiores (e etiquetados) por betweenness. Ou seja, aqueles nós que foram mais citados por grupos diferentes são os que têm maior centralidade. É interessante observar que esses nós, no exemplo, são justamente contas de veículos midiáticos que narravam o processo eleitoral. 2.7.1.3 Grau de Proximidade (Closeness)
O grau de proximidade é uma medida do quanto um determinado nó está próximo dos demais na rede.
23 O grafo apenas mostra os nós com mais de 10 tweets no período de coleta, a fim de priorizar o detalhamento necessário ao exemplo.
70
Trata-se de uma medida que leva em conta a distância média entre um nó e os demais nós da rede. A medida de proximidade auxilia a compreender, por exemplo, o quão distante um determinado nó está do “burburinho”. Quanto menor sua medida de proximidade, mesmo que o nó esteja mais periférico no grafo, mais próximo dos demais (e portanto, mais sujeito a influências) ele está. Essa é uma medida relevante para analisar casos de influência e de alcance de informações, por exemplo. Os nós precisam estar próximos para ser influenciados e poder receber informações de outros nós. Quanto mais distante um nó está dos demais, mais demorará para receber uma informação na rede. Portanto, essa medida é bastante relevante para que se compreenda também o papel dos nós na difusão e na recepção da informação. Em alguns casos, a medida pode ser invertida (o inverso da média da distância dos demais) e, nesses casos, quanto maior a centralidade, mais próximo dos demais está o nó (Shneiderman, Hansen & Smith, 2011, p.41). Utilizando o mesmo exemplo anterior (a rede em torno da hashtag #eleicoes2014), vemos como a rede se altera quando examinamos essa centralidade (Figura 10). Ao invés dos veículos que tinham a frente na centralidade de intermediação, vemos que usuários comuns ganham a frente, pois se aproximam mais de outros usuários que comentavam o processo eleitoral.
71
Figura 10: Grafo em torno da hashtag #eleicoes2014 por grau de proximidade.
2.7.1.4 Centralidade de Autovetor (Eingenvector)
72
Ao contrário das medidas anteriores, a centralidade eigenvector ou de autovetor leva em conta não apenas as conexões dos nós que são avaliados, mas também suas conexões indiretas, ou seja, aquelas conexões dos que estão conectados ao nó em questão (Bonacich, 1972). Essa centralidade, assim, vai além do número de conexões, atribuindo valores para essas conexões de acordo com outras conexões. Assim, ela tende a apontar quais nós são mais centrais em seus clusters, baseada nos valores atribuídos pelas conexões recebidas em cada. Essa medida foca na influência do nó na rede. A ideia aqui é quantificar essa influência, através da avaliação dos nós. Com a métrica da centralidade eigenvector, é possível compreender melhor o quão relevante é o nó para
a rede, pois se avaliam também as conexões não diretas. Assim, não basta apenas um determinado ator ser central, mas leva-se em conta, também, se os atores que estão diretamente conectados a ele também são bem conectados. Essa métrica também é associada a prestígio e influência na rede.
Figura 11: Grafo em torno da hashtag #eleicoes2014. Tamanho dos nós correspondente a sua centralidade de autovetor.
No exemplo (Figura 11), observamos novamente a rede das #eleicoes2014 já apresentada nos itens anteriores. Observamos que o nó mais central mudou novamente. Agora é um outro veículo jornalístico (o @g1) que não apareceu nos dados anteriores com tanta centralidade. Isso porque suas conexões, para o algoritmo, são mais qualificadas que aquelas dos demais.
73
2.7.1.5 PageRank
Há mais de um tipo de centralidade que levam em conta a centralidade eigenvector. O PageRank é uma métrica baseada nos princípios da centralidade eigenvector. O algoritmo foi inicialmente proposto por Brin & Page (1998), em um artigo já famoso, no qual descreviam sua proposta original do Google. A ideia era utilizar o conhecimento das conexões da web (links) e seus nós (páginas) de modo a estimar a importância de uma página para o sistema de busca. O algoritmo de Brin & Page compreendia cada conexão como uma espécie de “voto” que associava a página a um valor maior e, com isso, a ranqueava de forma melhor na busca. O PageRank, com o tempo, entretanto, evoluiu para atribuir pesos diferentes às conexões, de acordo com a importância dos usuários de onde elas vinham (Newman, 2004). A principal diferença do PageRank para a centralidade proposta por Bonacich (1972) é seu melhor desempenho para grafos direcionados, porque há fatores diferentes de escala24. Mas, de um modo geral, o PageRank é considerado uma variação sobre a centralidade eigenvector, sendo inclusive referenciado por alguns autores como “PageRank eigenvector”. O PageRank, assim, qualifica as conexões recebidas e realizadas, estimando a importância de um determinado nó na rede se outros nós igualmente relevantes fazem conexões a ele.
24 Há ainda outras diferenças mais complexas, das quais não trataremos neste livro devido a sua proposta introdutória. 74
Figura 12: Grafo em torno da hashtag #eleicoes2014. Tamanho dos nós correspondente a sua centralidade pagerank.
No exemplo (Figura 12), vemos de modo mais claro como o Pagerank é baseado na centralidade de autovetor. Os nós mais centrais são os mesmos, com alguns outros também aparecendo. Vemos o @g1 como o mesmo nó central, como na Figura 9. 2.7.2 Métricas de Rede
As métricas de rede dizem respeito a medidas onde o nó não é o foco central mas este está, principalmente, na dimensão da rede como um todo e em suas propriedades e características. Aqui, o que se busca investigar é a rede como um todo e não os nós de forma particular. Essas
75
métricas auxiliam não só, por exemplo, a identificar comunidades ou grupos nas redes (os clusters), bem como verificar redes mais ou menos densas, que podem indicar participação, etc. Em geral, as métricas de rede são utilizadas de forma conjunta às métricas de nó. Cada uma contribui de uma maneira para que se compreenda a estrutura do grafo. A seguir abordamos as medidas de densidade, grupabilidade, buracos estruturais, modularidade e centralização. 2.7.2.1 Densidade
76
A densidade do grafo refere-se à quantidade de conexões em relação ao número total de conexões possíveis. Assim, quanto maior a densidade, mais interconectado o grafo está. Quando uma rede tem o número máximo de conexões possíveis, diz-se que é um clique. Redes mais densas são, assim, aquelas onde há mais conexões entre os nós. Borgatti et al. (2009) associam a densidade em redes sociais à conectividade da rede, ou seja, ao quão interconectado é um grupo que está sendo analisado. Assim, a densidade é também uma propriedade associada à coesão da rede. Em geral, a densidade também é associada, por exemplo, à presença de “comunidades”, ou “clusters”. No exemplo (Figura 13), vemos duas redes sobre temáticas relacionadas à Copa do Mundo de 2014. Na primeira rede, em torno dos usuários que usaram a hashtag #EstadaonaCopa, a densidade é ligeiramente maior (os nós estão mais interconectados) do que na segunda rede, com usuários que tuitaram sobre a animação do Fuleco,
mascote da Copa, imitando a dança do jogador Kidiaba25. Essas diferenças de densidade sugerem que, na segunda rede, os usuários estavam mais dispersos e referenciaram uma maior quantidade de outros atores, ao passo que na primeira rede uma mesma fonte (@Estadao) é referenciada com mais intensidade.
Figura13: Grafo com os tweets obtidos através da hashtag #EstadaonaCopa (rede mais densa a esquerda) e com os tweets sobre o Fuleco imitando Kidiaba (rede menos densa, a direita)
A medida da densidade também pode auxiliar a compreender os buracos estruturais e as formas de interconexão de diferentes redes. 2.7.2.2 Grupabilidade ou Clustering
A grupabilidade (clustering) é um conceito na teoria dos grafos derivado dos estudos sobre a percolação. Junto com a teoria dos laços fortes e dos laços fracos e 25 Durante a Copa, a cada gol era exibida nos telões dos estádios uma animação do mascote da Copa, o Fuleco, comemorando o gol. Em uma dessas animações o Fuleco aparecia imitando o goleiro Kidiaba, do Mazembe. A dança do jogador se tornou conhecida no Brasil quando a equipe do Mazembe derrotou a equipe do Internacional de Porto Alegre na final do Mundial de Clubes em 2010.
77
78
a teoria dos buracos estruturais, a teoria da grupabilidade (ou agrupamento) oferece os elementos necessários para descrever uma rede do ponto de vista estrutural. Na matemática, a percolação foi originalmente definida pelo matemático e físico suíço Daniel Bernoulli para descrever a organização de grupos em um grafo. No modelo de Bernoulli, todas as conexões são independentes, e a percolação descreve um gráfico aleatório com probabilidade p = 1/N. Na teoria dos grafos, assim como na análise de redes sociais, a grupabilidade é uma medida que expressa o grau de ligação entre os nós. As redes sociais existentes tendem a agrupar os nós em grupos coesos com uma densidade relativamente alta de conexões, e a probabilidade de uma nova conexão ser criada dentro dos grupos é maior que a probabilidade de uma nova conexão ser estabelecida fora dos grupos internos da rede (Watts & Strogatz, 1998). Essa medida é expressa por meio de um coeficiente que pode ser calculado para a rede completa (coeficiente de grupabilidade global), ou para nós específicos da rede (coeficiente de grupabilidade local). A medida de grupabilidade global expressa o nível de agrupamento na rede completa, enquanto a medida de grupabilidade local indica o grau de inserção de um nó específico dentro dos grupos existentes na rede. A grupabilidade é calculada com base em tríades (ou tripletos) de nós. As tríades podem ser abertas, quando incluem três nós interconectados por duas conexões (tríade), ou fechadas, quando incluem três conexões entre os três nós. Um triângulo, por sua vez, é o resultado de três tríades fechadas referentes a cada nó da tríade. O coeficiente de grupabilidade expressa exatamente o nú-
mero de tríades fechadas (ou de conjuntos de três triângulos) em relação ao número completo de tríades abertas ou fechadas. O primeiro estudo que mediu esse coeficiente de grupabilidade foi feito por Luce & Perry (1949), que apresentaram uma medida de grupabilidade para toda a rede (global) a qual podia ser aplicada tanto para redes direcionadas quanto para redes não direcionadas. Por fim, o coeficiente de grupabilidade local expressa o índice de grupabilidade dos nós vizinhos, cujo ponto máximo é a interconectividade entre todos os nós que formariam um clique. Watts e Strogatz (1998) introduziram essa métrica para determinar se o grafo em questão forma ou não uma rede mundo-pequeno (“small -world”). De acordo com os autores, uma rede pode ser considerada “small-world” quando a média dos coeficientes de grupabilidade é significativamente maior do que se poderia esperar pela construção aleatória de um grafo com o mesmo número de nós e com aproximadamente a mesma distância média entre os nós. Essa técnica, como seria de se esperar, enfatiza nós com baixa conectividade em comparação com outras métricas (por exemplo, transitividade) cuja ênfase recai sobre nós com alta conectividade (degree). Com isso, o coeficiente de grupabilidade local para um nó é definido pela proporção de conexões entre nós na vizinhança dividida pelo número de conexões possíveis entre esses mesmos nós. Uma vez que em gráficos direcionais a conexão entre os nós N1aN2 é diferente da conexão N2aN1, o cálculo do coeficiente de grupabilidade é diferente para redes direcionais e para redes não direcionais. Essas diferenças são descritas mais detidamente na última seção desse capítulo.
79
O grafo a seguir (Figura 14) mostra a rede de menções (citações) no Twitter relacionada com o incêndio da boate Kiss em Santa Maria, através das hashtags #forçasantamaria e #santamaria26. O alto grau de clusterização de alguns nós indica a difusão de mensagens de apoio, principalmente publicadas por celebridades e usuários com número expressivo de seguidores.
Figura14: Rede de menções a usuários relacionada ao incêndio da boate Kiss.
2.7.2.3 Buracos Estruturais
Como vimos na seção anterior, redes sociais comumente exibem conexões densas que caracterizam a grupabilidade de um conjunto de nós. Em razão da coesão
26 O incêndio na boate no RS aconteceu em janeiro de 2013 e matou centenas de pessoas. 80
interna desse grupo de nós, a informação compartilhada pelo grupo tende a ser homogênea e frequentemente redundante, pois os nós dentro do grupo têm acesso às mesmas fontes que trocam e reforçam o mesmo conjunto de informação. Um cenário comum nas redes sociais ocorre quando diversos grupos permanecem compartilhando as mesmas informações entre si em razão da ausência de conexões que façam uma ponte entre os diversos grupos isolados. Nesses casos específicos, é possível identificar a existência de buracos estruturais na estrutura da rede. Essa formulação conceitual foi originalmente proposta por Ronald Burt em sua teoria dos buracos estruturais do capital social. Para Burt (2001), dadas duas ego-redes X e Y com o mesmo número de conexões, mas onde as conexões da ego-rede Y são dentro do grupo e as conexões da ego-rede X são com nós fora do grupo imediato, a egorede X receberá maior fluxo de informação inédita em razão da existência de buracos estruturais (Figura 15).
Figura 15: Buraco estrutural.
81
82
Em razão desses buracos estruturais, um nó precisa estabelecer uma conexão com outro nó que não faça parte do mesmo grupo para ter acesso a informações originais, pois informações não redundantes são normalmente obtidas através do contato com nós em diferentes grupos (clusters). A conexão entre nós que pertencem a grupos distintos representa um ganho competitivo em função da ligação de grupos e nós da rede que se encontravam separados e isolados por um buraco estrutural. Destarte as múltiplas e diferentes configurações que as redes sociais podem adquirir, a estrutura ideal consiste em uma diversidade de grupos conectados entre si de modo a evitar a incidência de buracos estruturais. Redes com buracos estruturais proeminentes levam à distribuição desigual de capital social na rede e estabelecem posições privilegiadas para determinados nós com relação às fontes de informação. O resultado dessa estrutura é que os nós capazes de conectar os buracos estruturais têm acesso a um conjunto de informação que os demais nós da rede não têm. Outra maneira de descrever a existência de buracos estruturais consiste na qualificação das conexões como fortes ou fracas, tal como proposto por Mark Granovetter (1973; 1974). Nesse estudo seminal, o autor qualificou as conexões de indivíduos entre fortes (família, amigos, etc.) e fracas (colegas de trabalho, conhecidos, etc.) e descobriu que informações sobre ofertas de emprego normalmente apareciam por meio das conexões (ou laços) fracos. De um ponto de vista estrutural, isso ocorre porque esses nós têm acesso a um conjunto de outros nós que circulam informações alienígenas para o grupo primário do nó em questão. Por meio desses
contatos incidentais (laços fracos), um indivíduo pode ter acesso a informações que de outro modo lhe seriam desconhecidas. Outro benefício essencial que um nó pode exercer ao servir de ponte entre diferentes grupos e buraco estrutural da rede é a função de corretor (broker). Um indivíduo cujos contatos transcendam os limites do grupo é capaz de detectar oportunidades sobre as quais o restante do grupo ainda não tem conhecimento. Ao servir de corretor para o fluxo de informação entre dois grupos, grupos esses que permaneceriam isolados sem a corretagem do indivíduo em questão, esse nó em específico tem acesso a novas ideias, opiniões e informações oriundas precisamente do acesso a diversos grupos separados pelos buracos estruturais na rede. Esse nó-corretor adquire uma posição privilegiada com ganho considerável de capital social e acesso estratégico à informação (information brokerage), mas os benefícios dessa conexão não se restringem ao nó-corretor. O grupo como um todo se beneficia das múltiplas conexões desse indivíduo, que funciona como fonte fundamental para ideias e opiniões que de outro modo não seriam encontradas no grupo. Nos termos de Granovetter (1973; 1974), a posição estrutural dos corretores de informação (information broker) é uma decorrência da organização dos nós em comunidades com alta incidência de laços fortes e alta coesão local, mas fraca incidência de laços fracos e frágil coesão global. Borgatti & Lopez-Kidwell (2011:61) argumentam que a teoria de Burt (2001) pode parecer diferente da proposição de Granovetter, mas no fim das contas as diferenças são uma questão semântica e de enfoque
83
do objeto. Na abordagem estrutural de Burt (2001), a ego -rede X tem mais buracos estruturais do que a ego-rede Y, o que é compatível com a constatação de que a ego-rede X tem mais conexões não redundantes. Nos termos de Granovetter, a ego-rede X tem mais laços fracos que a ego-rede Y. Com isso, ambas as proposições teóricas indicam a existência de um arranjo topológico na rede que promove ou inibe a circulação de informação inédita. 2.7.2.4 Modularidade
84
A modularidade é uma métrica para análise de redes que identifica os grupos subjacentes à estrutura da rede (Figura 16). A modularidade é calculada tendo por base a separação dos nós da rede em módulos (ou comunidades). Essas comunidades, por sua vez, são definidas como grupos de nós densamente interligados entre si e fragilmente conectados com o resto da rede. Com isso, redes com alta modularidade tendem a ter conexões densas entre os nós de cada comunidade e poucas conexões com nós de outras comunidades (ou módulos). Em razão do método otimizado de cálculo para a modularidade, a modularidade é frequentemente empregada para a detecção de estrutura de comunidade em redes sociais. Além das redes sociais, o algoritmo é empregado frequentemente em redes homogêneas como as redes neuronais ou biológicas, que exibem elevado grau de modularidade. Ferramentas de análise de redes sociais como igraph e Gephi incluem o algoritmo para cálculo da modularidade (igraph a partir da versão 0.4 e Gephi já na versão inicial 0.7alpha).
Figura 16: Exemplo de rede particionada em módulos. As comunidades indicam diferentes grupos temáticos (filmes, cinema, esportes, política etc.).
O cálculo da modularidade é possível em razão das propriedades matemáticas e topológicas das redes. O algoritmo, que frequentemente revela características estruturais inesperadas, é calculado tendo por base a fração de conexões (ou arestas) presentes dentro de um grupo menos a fração de conexões em uma rede hipotética e aleatória. O valor da modularidade é positivo se o número de conexões dentro dos grupos ultrapassa o número esperado na comparação com a projeção hipotética. Os módulos, com isso, são calculados e definidos em comparação com uma rede hipotética e aleatória com o mesmo número de nós e arestas (conexões), mas onde as conexões são distribuídas de maneira aleatória. A modularidade, com isso, indica a concentração de conexões dentro de comunidades em comparação com a distribuição aleatória dessas mesmas conexões. Em decorrência desse princípio, uma
85
comunidade (cluster) com alta grupabilidade apresentará um coeficiente de modularidade mais alto e uma taxa de transmissão de informação mais eficiente se comparada com uma comunidade com poucas conexões entre si. Não obstante seu desempenho positivo e implementação elástica, o algoritmo de modularidade tem um limite rígido de resolução e normalmente falha na tentativa de capturar comunidades pequenas ou heterogêneas. Isso ocorre especialmente em grafos completos e fracamente interconectados com alta densidade possível de conexões internas. Embora nesses grafos a identificação das comunidades seja simples em função da distribuição de nós e grupos, o algoritmo da modularidade falha em perceber a separação dos grupos em razão da diferença relativamente pequena entre a conexão entre grupos de nós e entre nós conectados entre si. Há métodos distintos para calcular a modularidade de uma rede, e a otimização do algoritmo invariavelmente procura resolver os limites na identificação de pequenas comunidades, mas o limite permanece para todos os métodos que implementam a modularidade com base em um modelo nulo. 2.7.2.5 Centralização
86
A centralização é uma medida focada no quão centralizado um grafo está em torno de determinados nós. Scott (2004) define a centralização em relação à densidade. Para o autor, enquanto a densidade foca o “nível de coesão geral” de um grafo (aqui entendido como o quão interconectado ele está), a centralização foca em torno de quais pontos focais essa coesão está organizada (p.89). Por isso, diz-se que essas medidas são complementares.
Assim, se uma rede tem uma alta centralização, isso significa dizer que há poucos nós “segurando” a rede como um todo, ou seja, centralizando a rede. ***
Neste segundo capítulo, vimos os principais conceitos e métricas utilizadas pela ARS, já com exemplos direcionados para a mídia social. Esses elementos são essenciais para que se compreenda como aplicar análise de redes para os estudos de redes sociais. Entretanto, ainda falta discutirmos o que compreendemos, neste livro, pelo conceito de mídia social e como este conceito pode ser aplicado. Esses elementos serão tema do próximo capítulo.
87
3 Coleta e Análise de Dados
Para trabalhar com análise de redes sociais e mídia social, é preciso, primeiro, definir como será feita a coleta de dados diante da questão de pesquisa que será explorada pelo pesquisador. Como dissemos anteriormente, a mídia social oferece oportunidades muito relevantes de análise de dados, entretanto, ao mesmo tempo, oferece perigos e dificuldades. Neste capítulo, vamos discutir as questões práticas de coleta e análise de dados, bem como apresentar algumas aplicações através de estudos de caso específicos, e, finalmente, elaborar algumas críticas e cuidados para aplicação de ARS. Um primeiro passo, evidentemente, é delimitar qual tipo de dado é relevante para o problema de pesquisa, as possibilidades de coletá-lo e a “fazibilidade” do estudo que se tem em mente como um todo, bem como seus limites. Por exemplo, em algumas ferramentas, como o Facebook, a coleta de dados é extremamente limitada (apenas uma parte pequena dos dados publicados de forma aberta – ou seja, não fechados para amigos e amigos de amigos – pode ser coletada, o que significa que os resultados terão essa tendência). O Twitter, embora não tenha
89
essa limitação de forma tão clara (a maioria das pessoas o utiliza de forma pública), é limitado pelo tipo de público que ali está (que não é um reflexo uniforme, por exemplo, da população brasileira). Desse modo, o pesquisador precisa levar em conta os limites e as vantagens de seus dados e explicitar essas questões de forma clara em seu trabalho, compreendendo exatamente que tipo de dado é possível coletar e como este dado reflete ou não como amostra o universo possível. Evidentemente, nem todo o estudo precisa ser quantitativo. Estudos qualitativos e localizados de contextos específicos de dados também podem ter resultados interessantes, desde que esses limites sejam claramente explicitados. Finalmente, é preciso também delimitar o que constituirá as conexões e o que constituirá os nós da rede em questão. Assim, uma conexão será uma relação de citação no Twitter? Ou uma relação de seguidor? Os nós serão consideradas as contas dos usuários? Ou conceitos/ palavras ou notícias que estão circulando? Obviamente que essas definições dependem do problema de pesquisa e do objeto em questão, mas são prioritárias antes do trabalho de coleta e análise destes dados.
3.1 Coleta de Dados
90
O primeiro passo para uma Análise de Redes Sociais de uma rede social em um site de rede social é definir o que são os nós e o que são as conexões (Fragoso, Recuero& Amaral, 2011). Normalmente, os nós são os atores sociais, representados através de seus perfis na rede. Esses perfis podem representar indivíduos, grupos de indivíduos ou instituições. Cada representação de um
ator social, constitui, assim, um nó na rede de um site de rede social. Também é possível estudar a relação entre conteúdos em um site de rede social através da ARS. Nesse caso, os nós podem ser as mensagens compartilhadas entre os usuários. Cada mensagem pode, assim, representar um nó. Já as conexões podem representar relações variadas e mudar em cada tipo de site de rede social. Assim, no Twitter, por exemplo, as conexões podem ser estudadas a partir da relação entre seguidos e seguidores, mas também a partir de menções e retweets entre os perfis. Assim, uma conexão é estabelecida entre dois atores sociais quando um ator menciona o outro em uma de suas publicações, ou ainda quando um usuário segue o outro ou é seguido por ele na rede. No Facebook, as conexões podem ser estabelecidas entre os amigos – ter alguém em sua lista de contatos significa possuir uma conexão com essa pessoa. Mas também é possível analisar, por exemplo, a pertença a grupos comuns ou o fato de curtir páginas em comum como uma relação de conexão entre dois ou mais atores. O segundo passo para delimitar os procedimentos de coleta de dados é planejar a quantidade de dados que é necessária para satisfazer a questão de pesquisa. Essa decisão vai fornecer o primeiro guia a respeito da abordagem de coleta: Se é um estudo qualitativo (o foco é na qualidade dos dados) ou quantitativo (o foco é na quantidade de dados). Estudos qualitativos geralmente trazem um conjunto pequeno de dados, que podem ser coletados de forma mais simples, até mesmo de forma manual pelo pesquisador. Estudos quantitativos, em geral, necessitam de
91
92
uma abordagem mais complexa e dificilmente não precisarão de softwares de coleta. Coletar dados relacionais na Internet é um grande desafio pela pluralidade de representações das redes. Nesse sentido, há redes que são denominadas associativas ou de filiação e redes que são denominadas emergentes (Recuero, 2009; Recuero & Zago, 2009). Enquanto as primeiras determinam relações mais ou menos estáveis, conexões mantidas pelas ferramentas, as segundas focam relações mais dinâmicas de fluxos conversacionais. Assim, é preciso decidir se as conexões mapeadas serão, por exemplo, relações de seguidos/seguidores ou de menções e respostas (Twitter), ou ainda de “amigos” ou de conversações (Facebook). Cada uma dessas redes vai informar elementos diferentes da estrutura social da rede onde “A” está inserido (vide Huberman, Romero & Wu, 2009, por exemplo). A partir dessa delimitação, é preciso elaborar a es-tratégia de coleta de dados. Os dados serão coletados de redes egocentradas ou redes inteiras? Qual será a limitação estabelecida? Um outro elemento é identificar a direção das conexões. É preciso compreendê-las para saber se os dados serão coletados por um grafo direcionado ou não direcionado. Os grafos direcionados têm suas conexões representadas por flechas que indicam a direção da conexão. Os não direcionados, por outro lado, não utilizam essa representação. E há implicações diferentes em cada uma delas. Por exemplo, se estamos diante de uma rede emergente no Facebook, ou seja, estamos mapeando quem cita quem em uma conversação há, obviamente, uma rede direcionada. Quando A cita B, há uma conexão direta entre A -> B. Já quando mapeamos uma rede de amigos no Fa-
cebook, é natural que seja uma rede não direcionada, pois para que A seja amigo de B, este precisa aceitar. A conexão estabelecida, assim, é mútua e dispensa sua representação por flechas, tornando-se não direcionada. Assim, é importante delimitar muito bem o que será considerado uma conexão e como, pois conexões direcionadas e não direcionadas não podem coexistir no mesmo grafo (embora possamos ter conexões direcionadas nos dois sentidos, por exemplo AB se ambos se citaram). O último desafio da coleta de dados refere-se a sua “fazibilidade”. Justamente por conta dos rastros deixados online, constitui-se em uma significativa quantidade de dados, não sendo uma tarefa simples coletá-los. Por isso, a maioria dos estudiosos prefere usar elementos automatizadores para essas coletas, notadamente crawlers (ou robôs) que utilizam as APIs27 dos sites (application programming interface). Nada impede, entretanto, que coletas manuais também sejam realizadas, dependendo, aí, de outros procedimentos para construir as redes que serão estudadas. A seguir, comentaremos a respeito de alguns softwares e crawlers que são bastante usados para coleta e análise de dados de redes sociais online.
3.2 Softwares e Crawlers Embora exista um interesse crescente na utilização da abordagem de ARS para mídia social, parado-
27 As APIs são as “portas de entrada” através das quais muitos sites de rede social são acessados por terceiros, de forma especial, a parte à qual os desenvolvedores e seus programas têm acesso à ferramenta. Geralmente têm limites no acesso aos dados, impostos pelas próprias ferramentas e é importante conhecê-los. 93
xalmente, há um conjunto pequeno de ferramentas que podem auxiliar os pesquisadores. Alguns crawlers são simples de utilizar, mas há outros que exigem um certo conhecimento de programação. Além disso, dependendo da API que o crawler utiliza, há limitações importantes para a coleta de dados que o pesquisador precisa conhecer e cujas informações normalmente estão disponibilizadas nas próprias descrições. Com isso, muitos dos laboratórios e grupos de pesquisa hoje buscam desenvolver suas próprias ferramentas, adaptando scripts existentes ou mesmo criando seus próprios. A seguir, comentaremos alguns dos mais utilizados. Dentre as ferramentas mais utilizadas hoje para obter dados do Twitter, está o YourTwapperKeeper28(yTK). É preciso um servidor dedicado para rodar o yTK, que acessa a streaming API do Twitter e coleta ali os tweets que estão sendo publicados com uma determinada palavra-chave. Embora o script principal do yTK não tenha atualizações há anos, pelo seu formato aberto, diversas versões modificadas por outros pesquisadores foram adicionadas e disponibilizadas no decorrer dos anos, notadamente pelo grupo liderado por Axel Bruns, do projeto “Mapping Online Publics” que se dedica a estudar o uso do Twitter na Austrália29. O grupo já fez uma série de modificações no script e colocou essas modificações e instruções de forma pública, para que outros pesquisadores tenham acesso em seu site30,31. Outro grupo que desenvolveu scripts de coleta 28 https://github.com/540co/yourTwapperKeeper. 29 http://mappingonlinepublics.net/. 30http://mappingonlinepublics.net/2011/06/21/switching-fromtwapperkeeper-to-yourtwapperkeeper/. 31 http://mappingonlinepublics.net/2012/01/09/twapperkeeper-and-beyond-a-reminder/.
94
e análise de dados do Twitter e do Facebook é o Labic32, liderado pelo pesquisador Fábio Malini da Universidade Federal do Espírito Santo (UFES), no Brasil. O grupo também disponibiliza seus crawlers e scripts de análise no seu site no Github33. Os scripts do grupo estão baseados também no yTK e no Netvizz, que veremos a seguir. O Netvizz34 é outra ferramenta bastante utilizada, mas para o Facebook, desenvolvida pelo pesquisador Bernhard Rieder (2013) e mantido de forma pública por doações. Ele permite a coleta e análise de dados públicos (de páginas ou grupos) ou de sua rede pessoal ou grupos dentro dos quais você está na ferramenta. (É importante salientar que há limitações éticas no uso de dados de redes pessoais e de grupos, conforme explicitaremos na próxima sessão). O Netvizz está submetido também aos dados de privacidade de cada usuário e nem tudo pode ser coletado sendo importante ter em mente essas limitações. Ele também apenas provê dados anônimos para grupos e páginas, não permitindo que os nomes dos usuários apareçam nesses conjuntos. O Netvizz também é uma ferramenta um pouco lenta para a coleta de dados e quando há muitos dados, pode demorar. Um tutorial sobre como utilizar a ferramenta, feito pelo próprio Rieder, está disponível no YouTube35. Tanto o yTK quanto o Netvizz geram apenas um conjunto de dados, que precisam de outras ferramentas para ser analisados. Uma das ferramentas mais populares para a análise e a visualização de grafos é o Gephi36. O Gephi 32 http://www.labic.net/. 33 https://github.com/ufeslabic. 34 https://tools.digitalmethods.net/netvizz/facebook/netvizz/. 35 https://www.youtube.com/watch?v=XxH0Tm8NXik. 36 http://gephi.github.io/.
95
é uma ferramenta open source (aberta), desenvolvida por um conjunto de estudantes franceses (Bastian, Heymann & Jacomy, 2009). É hoje mantido por um consórcio de modo open source e tem uma grande comunidade de colaboradores e desenvolvedores de algoritmos de visualização a análise. O Gephi permite visualizar os dados e analisá-los utilizando as métricas de ARS. Para as ferramentas que descrevemos até agora, é necessário algum conhecimento técnico para uso e um investimento em compreender e ler a documentação das mesmas. Muitos dos grupos trabalham com cientistas de dados (data scientists) que constantemente modificam e aperfeiçoam os scripts para coleta de dados todos os dias, em cima das inúmeras modificações que são adicionadas e que quebram os crawlers pelos sites de rede social. Outras ferramentas, entretanto, são mais simples de ser utilizadas e mais amigáveis para aqueles que pretendem iniciar seus estudos e não têm recursos à disposição para compra e instalação de servidores, suporte técnico e mesmo espaço para a coleta de muitos dados. O NodeXL37 é uma delas. A ferramenta funciona como um plugin para o Microsoft Excel. Para instalá-lo, basta ter uma versão compatível (e legal) do software. O NodeXL foi criado pelo grupo do pesquisador Marc Smith, na Microsoft e, posteriormente, mantido por doações através da “Social Media Research Foundation”38 e pelo grupo “Connected Action”39 de forma gratuita. Por utilizar a estrutura do Excel, seu uso é facilitado. Ele já tem alguns crawlers embutidos (Twitter, por exemplo) e um plugin específico para acesso a outros sites de rede social que 37 http://nodexl.codeplex.com/. 38 http://www.smrfoundation.org/. 39 http://www.connectedaction.net/.
96
também precisa ser instalado (Social Network Importer40). O Social Network Importer permite a ampliação do crawler para outros sites, como o Facebook. O NodeXL é uma ferramenta bastante amigável e fácil de utilizar (em comparação com as demais). Entretanto também tem várias limitações. Ele utiliza outra API do Twitter, a Search API, que tem limitações diferentes da Streaming API (que é utilizada pelo yTK). Essas limitações estão em constante mudança e é preciso consultar os releases para entender quais são esses limites no momento. De um modo geral, a API permite a coleta de tweets de forma limitada para o passado (ou seja, não aqueles que estão sendo publicados no momento, mas aqueles que já foram arquivados), e dentro de um limite temporal e de número de dados. O NodeXL também tem ferramentas de limpeza dos dados, análise de redes e de visualização de grafos. Isso também é um elemento facilitador importante, uma vez que as ferramentas anteriores precisam de outros softwares para análise dos dados. Finalmente, é bom lembrar que o Excel é uma ferramenta limitada, ou seja, não permite a análise de grandes quantidades de dados (há um número máximo de linhas permitido pela ferramenta). Assim, o NodeXL é uma excelente ferramenta, mas permite a coleta e análise de quantidades relativamente pequenas de dados.
3.3 Análise de Dados A análise de dados para ARS é feita através de métricas, geralmente através de sotwares de análise, tais 40 http://socialnetimporter.codeplex.com/
97
como o Pajek41, Gephi ou NodeXL. São esses softwares que, através de algoritmos específicos, calculam as medidas e desenham a rede, também levando em conta determinadas formas de visualização. É preciso lembrar também que quanto maiores as redes que são coletadas, maior a quantidade de dados, mais memória é necessária para analisar esses dados e visualizá-los. O NodeXL, por exemplo, consegue analisar uma quantidade maior de dados do que consegue colocar no espaço de visualização. Os dados coletados são geralmente apresentados sob a forma de uma matriz. Essa matriz ou sociograma (Scott, 2004) é que vai servir de base para que seja gerado o grafo, ou a visualização dos dados. Essa visualização, entretanto, também depende de medidas construídas anteriormente, novamente, de acordo com o problema de pesquisa eleito pelo pesquisador. Finalmente, há diversos algoritmos de visualização, através dos quais a rede pode ser montada, cada um desenhado para que se consiga visualizar um conjunto de dados. Por isso, também é preciso ter em mente como visualizar esses dados. Além disso, é importante também salientar que a análise da rede deve se dar através das medidas e não do seu “desenho”, uma vez que esse pode não indicar elementos que sejam relevantes para o pesquisador. A seguir, vamos discutir um pouco dos princípios e algoritmos de visualização de dados mais utilizados. 3.3.1 Visualização de Dados
A visualização de dados é uma das principais áreas de desenvolvimento e investimento de pesquisa 41 http://vlado.fmf.uni-lj.si/pub/networks/pajek/
98
hoje, muitas vezes referida como “dataviz”. É igualmente importante dentro da análise de redes, porque auxilia a visualizar de forma mais clara os elementos dos dados obtidos. Nesta sessão, explicaremos brevemente alguns dos principais algoritmos utilizados para a visualização de redes e suas propriedades, notadamente aqueles que são mais populares nos softwares de visualização, como o Gephi, NetDraw42 ou mesmo Pajek43 e NodeXL. Há diversos tipos de algoritmos, desde aqueles que provêm layouts mais orgânicos, baseados em relações de força entre os nós (atração/repulsão) até aqueles que provêm visualizações mais geométricas, baseadas em layouts que levam em conta distribuições circulares ou em sino. A distribuição dos nós para a visualização dos dados, embora tenha um claro fundamento estético, precisa também ser informativa. Um dos principais problemas aqui é o tipo de visualização que cada conjunto de dados requer. Conjuntos de dados muito pequenos, por exemplo, requerem pouca sofisticação em sua visualização, enquanto conjuntos maiores de dados podem se beneficiar mais de visualizações mais complexas. A maioria dos algoritmos e softwares, entretanto, não consegue escalar a visualização para uma quantidade muito grande de dados (por exemplo, na casa dos milhares de nós) de forma eficiente. No exemplo da Figura 17, gerou-se um grafo de uma rede egocentrada (todos os usuários estão conectados ao ego) no NetDraw com muitos nós, ao ponto de a representação da rede não permitir distinguir as conexões entre os nós. 42 https://sites.google.com/site/netdrawsoftware/home. 43 http://vlado.fmf.uni-lj.si/pub/networks/pajek/. 99
Figura 17: Grafo de rede com muitos nós em que não é possível identificar claramente as conexões.
100
Quando a quantidade de dados é muito grande, é preciso quebrar o grafo em várias partes, observando cada uma delas em separado. Como o objetivo aqui é prover o pesquisador de elementos para uma observação visual dos dados, é preciso que o grafo seja claro. Dentre os princípios gerais em cima dos quais uma boa visualização é baseada, estão o cruzamento mínimo das arestas, uma distribuição equilibrada de vértices e alguma simetria (Hu, 2005). A seguir, listamos alguns dos principais tipos de algoritmos de visualização. A maioria dos algoritmos utilizados para visualização são aqueles baseados em força. Os algoritmos deste tipo buscam estabelecer visualizações baseadas em analogia dos nós e arestas com forças físicas (como por exemplo, força de mola, força elétrica, etc.). Esses algoritmos estabelecem, assim, relações de força de atração e repulsão entre os nós dos grafos baseados apenas nas informações do próprio grafo (Kobourov, 2012). A grande diferença entre eles é a forma através da qual a força é aplicada aos nós, que vai resultar em dis-
tâncias e espacializações diferentes. Além disso, esses algoritmos são baseados em iterações, ou seja, em um conjunto de repetições cujo número pode, muitas vezes, ser estabelecido pelo usuário. Outros algoritmos podem ser baseados em formatos específicos, como aqueles geométricos, de mapa, arco ou árvores. Neste caso, o principal é que a visualização segue um formato específico. A seguir, discutiremos brevemente alguns dos principais algoritmos utilizados. 3.3.1.1 Fruchterman-Reingold
O Fruchterman-Reingold é um algoritmo de visualização de grafos com um desenho baseado na força (force-based layout), apresentado em um artigo dos autores de 1991. Esse tipo de sistema combina forças de aproximação (baseada em força de mola) e repulsão (baseada em força elétrica) entre os nós, de forma a distribuí-los no espaço. O algoritmo é focado em:
1. Distribuir os vértices de forma igual no espaço. 2. Minimizar o cruzamento das arestas; 3. Fazer com que as distâncias entre as arestas fiquem uniformes; 4. Refletir simetria inerente; 5. Estar de acordo com o espaço disponível.” (Fruchterman & Reingold, 1991, p. 1129) 44
Esse é um dos mais populares algoritmos de visualização de redes hoje, utilizado pela maioria dos softwa-
44 Tradução dos autores para: “1. Distribute the vertices evenly in the frame. 2. Minimize edge crossings. 3. Make edge lengths uniform. 4. Reflect inherent symmetry. 5. Conform to the frame”.
101
res. Na prática, o algoritmo determina a movimentação dos nós no grafo pela soma das forças, de forma a minimizar a energia quando o sistema se equilibra. O movimento dos nós pode ser observado em interações dentro do sistema, que são delimitadas de forma análoga aos sistemas naturais. Assim, enquanto todos os nós se repelem, vértices vizinhos se atraem (o que torna os clusters mais visíveis). Na base, a atração é determinada pela presença das conexões entre os nós (Fruchterman & Reingold, 1991). Os nós tendem a se mover de forma mais rápida ou mais devagar de acordo com a “temperatura” do grafo (energia) e, em alguns casos, podem não chegar a um equilíbrio após várias iterações. Alguns autores recomendam o uso desse algoritmo apenas para grafos com até mil nós. No exemplo a seguir (Figura 18), temos um grafo de usuários que utilizaram uma determinada hashtag no Twitter, montado através do Fruchterman-Reingold. O grafo tem cerca de cinco mil nós e sete mil conexões. Os nós representam usuários únicos e as conexões, citações ou retweets.
Figura 18: Exemplo de grafo Fruchterman-Reingold.
102
3.3.1.2 ForceAtlas e ForceAtlas2
O algoritmo ForceAtlas foi desenvolvido por Jacomyem 2007 (Jacomy et al., 2011), visando a melhorar a visualização de grafos onde os nós ficavam muito em cima uns dos outros. É também um algoritmo dirigido por força, como os anteriores, baseado também em Fruchterman -Reingold. Entretanto, “sua particularidade é uma repulsão dependente do grau, que melhora a visualização dos nós» (Jacomy et al., 2011)45. Ou seja, o ForceAtlas computa na força de repulsão de cada nó seu grau, o que é bastante diferente dos casos anteriores. Enquanto o ForceAtlas lida com menos dados, o ForceAltas2 funciona bem com grafos bem maiores (um milhão de nós, por exemplo). Como nos algoritmos anteriores também baseados em força mecânica, enquanto os nós têm força de repulsão (como magnetos), as arestas atraem os nós que conectam (como molas) (Jacomy et al. 2011). O objetivo final também é de os aproximar por vizinhança, de forma a criar cluster ou comunidades. A diferença básica entre o ForceAtlas e o ForceAtlas2, grosso modo, é que o segundo é um aperfeiçoamento do primeiro, muito mais rápido para atingir um estágio de equilíbrio relativo especialmente quando se lida com grafos grandes. O ForceAltas2, que foi desenvolvido de forma específica para redes sociais e grafos web, também tende a aproximar um pouco mais os nós pouco conectados, deixando o grafo menos espalhado (Jacomy et al., 2011). No exemplo a seguir (Figura 19), temos o mesmo conjunto de dados de usuários que utilizaram uma deter45 Tradução dos autores para: “ Its particularity was a degree-dependant repulsion force that causes less visual cluttering”.
103
minada hashtag no Twitter, com o grafo montado, desta vez, através do ForceAtlas2.
Figura 19: Grafo com ForceAtlas 2
3.3.1.3 Yifan Hu
104
No exemplo a seguir (Figura 20), temos o mesmo conjunto de dados de usuários que utilizaram uma determinada hashtag no Twitter, com o grafo montado, desta vez, através do ForceAtlas2 que também é um algoritmo baseado em força. A grande diferença prática dele para os demais é sua rapidez, tornando os grafos menos complexos. O algoritmo foi originalmente apresentado em um trabalho de 2005 (Hu, 2005), ocasião em que conjuntamente à proposta de força, Hu também apresentava uma proposta multi-escala (ou seja, escala multidimensional). Conforme vimos, os algoritmos baseados em força tendem a procurar um equilíbrio onde há o mínimo de energia dispendida entre os nós. Um dos grandes problemas desses algoritmos (como o algoritmo de Fruch-
terman-Reingold, por exemplo), é que o grafo tenderia a se estabilizar uma vez atingindo um mínimo local, o que não deixaria o grafo dentro da melhor visibilidade, especialmente entre os nós mais distantes. O algoritmo de Hu, assim, traz a proposta de multiescala para tentar evitar esse mínimo local, buscando um equilíbrio mais global, também focado em grafos com muitos nós (cerca de 100 mil nós).
Figura20: Grafo Yifan Hu
3.3.1.4 OpenOrd
O OpenOrd é um algoritmo desenvolvido por Martin et. al. (2011), também baseado em força, mas para grandes grafos não direcionados (cerca de um milhão de nós, por exemplo). Uma de suas principais vantagens é a escalabilidade, pois seria capaz de atuar com mais de um milhão de nós de forma eficiente, incorporando uma
105
abordagem multi-level, baseada no algoritmo de Fruchterman-Reingold. O OpenOrd atua com um número fixo de iterações e permite que as diversas fases de construção do grafo sejam ajustadas pelo usuário.
Figure 21: Grafo Open Ord
106
3.4 Problemas Éticos e Limitações Outra questão importante que precisa ser observada nos estudos de ARS nas redes sociais na Internet são as limitações dessa abordagem e suas questões éticas. Um dos primeiros problemas diz respeito ao anonimato dos dados, por exemplo (vide Kadushin, 2005). Embora na prática, os sites de rede social explicitem que seu conteúdo está sendo (em sua maioria) publicado, ou seja, torna-
do público e que, naqueles onde opções de privacidade são oferecidas (como o Facebook e o Twitter, por exemplo), o único conteúdo que poderá ser buscado nas APIs é o público, há que se argumentar a dificuldade de compreensão dos públicos em geral das consequências desse ato. Assim, informações que tenham sido publicadas, especialmente, aquelas pessoais ou talvez, publicadas impensadamente pelos sujeitos de pesquisa podem trazer efeitos para estes se utilizadas em pesquisas. Kleinberg (2007), por outro lado, alerta que devido ao formato das informações nessas redes sociais, muitas vezes é muito difícil manter a privacidade dos indivíduos, mesmo com os dados anonimizados. Entretanto, é um problema que precisa ser focado pelos pesquisadores, se não na coleta, ao menos na apresentação dos dados de pesquisa. Outra questão ética é o uso de dados de redes fechadas, às quais o pesquisador tem acesso por fazer parte do grupo. Assim, por exemplo, é possível mapear um determinado grupo fechado do qual se faz parte. Mas as implicações éticas desse mapeamento (uma vez que o grupo é fechado) também precisam ser discutidas, uma vez que os atores mapeados podem não ter conhecimento de que seus dados estão sendo utilizados para pesquisa. O pesquisador, portanto, precisa compreender que é preciso ter essa preocupação e estabelecer rigor ético para sua pesquisa. Muitas universidades brasileiras oferecem comitês de ética que avaliam a proposta de pesquisa e a preocupação do pesquisador, para as quais qualquer pesquisa que atue diretamente com seres humanos precisa ser submetida. Embora boa parte desses comitês fosse originalmente focado em pesquisas nas áreas médicas, sua atuação nas Ciências Sociais Aplicadas e em ou-
107
tras áreas é cada vez maior. A preocupação com o acesso a grandes quantidades de dados sobre os indivíduos, especialmente na Internet, também tem inaugurado discussões sobre os limites éticos dessas pesquisas (vide boyd & Crawford, 2012, por exemplo). Um bom guia a respeito das questões éticas referentes à pesquisa online foi disponibilizado pela Association of Internet Researchers (AOIR)46 em 2012. O guia oferece questões centrais às quais o pesquisador deve pensar para discutir os fundamentos éticos de seu trabalho e quais cuidados deverá ter na coleta e análise dos dados. Alguns desses elementos a serem levados em consideração (Markhan & Buchanan, 2012, p. 4-5) são abordados a seguir: a) Vulnerabilidade da população estudada, que está diretamente relacionada à necessidade de proteção de seus dados por parte do pesquisador.
b) Possível prejuízo dos sujeitos pesquisados com os métodos, resultados ou publicação do trabalho.
c) Balanço entre direitos dos sujeitos de pesquisa com os benefícios sociais da pesquisa, direitos do pesquisador de conduzir a pesquisa. d) As questões éticas que poderão surgir em todas as fases da pesquisa precisarão ser discutidas em cada uma delas. e) Para tomar decisões sobre as questões éticas, recomenda-se a consulta ao maior número possível de fontes, colegas, artigos.
46 http://aoir.org/reports/ethics2.pdf 108
Embora a maior parte das recomendações envolva particularmente a participação direta de seres humanos na pesquisa, é importante salientar a necessidade da reflexão também com relação aos dados, mesmo quando estes são “públicos”. Nem sempre os comitês de ética analisam questões não relacionadas diretamente ao contato com pessoas (como o uso de dados ou de bancos de dados não anônimos), mas a reflexão é importante e inclusive necessária para a publicação em algumas revistas e journals. Dentre as várias estratégias para lidar com esses dados, a anonimização de dados públicos que possam ser sensíveis (principalmente aqueles que envolvem sujeitos comuns, por exemplo, e não pessoas públicas ou veículos), a autorização expressa para uso dos dados para pesquisas envolvendo o contato direto com sujeitos (entrevistas, por exemplo) e a autorização de comitê de ética para pesquisas que envolvam seres humanos são essenciais. Outra questão importante envolve as limitações da abordagem e seus impactos nos resultados da pesquisa. A primeira dessas limitações diz respeito a seu foco estrutural, nos padrões emergentes das interações. Assim, não se presta para estudos cujo foco não seja estrutural. Se o objetivo de uma pesquisa é trabalhar com um determinado discurso nas redes sociais, por exemplo, mas não se deseja observar os padrões de reprodução desse discurso, a abordagem da ARS não oferece contribuições. Além disso, seu foco em medidas e dados também pode ser enfraquecido quando o objetivo é construir uma análise mais teórica em cima dos fenômenos. A ARS tem um foco extremamente empírico, e o método e o estudo dos dados são extremamente relevantes. Outras limitações
109
dizem respeito aos limites impostos pelas ferramentas, tanto na coleta quanto na análise de dados. A própria API da qual os dados são extraídos, por exemplo, pode oferecer limitações que precisam ser claramente compreendidas pelo pesquisador, sob pena de uma análise parcial ser tomada como uma análise completa. O conhecimento das métricas e das formas de visualização das redes também são essenciais para que se realmente compreenda o que os dados querem dizer.
110
4 Aplicações de ARS para Mídia Social
Neste capítulo trazemos alguns exemplos de aplicações de métricas e técnicas de análise de rede sociais para mídia social. O objetivo é mostrar de forma mais prática como a análise de redes sociais pode auxiliar aqueles interessados em desenvolver pesquisas e quais tipos de pesquisas em mídia social são propícias para o uso da abordagem. Explicamos na introdução os conceitos básicos de mídia social e como compreendemos este espaço e as informações que são publicadas ali. Agora, buscaremos discutir algumas práticas de análise e objetos específicos que se prestam ao estudo através da ARS. Conforme vimos nos capítulos anteriores, elementos como coleta de dados (e suas limitações), formas de análise e visualização precisam ser objetivamente pensados pelo pesquisador e buscaremos mostrar a linha que guiou parte de nossos estudos. Apresentaremos como exemplos práticos objetos e estudos que têm sido típicos dos nossos grupos de
111
pesquisa (MIDIARS47) nesses últimos anos. Por conta disso, traremos três focos principais: Participação Política, Discurso e Jornalismo. Os três estudos também trazem um objeto específico, o Twitter, embora trabalhos em outras plataformas também sejam possíveis. Também é importante salientar que a ARS tem sido utilizada, principalmente, em contexto de abordagens metodológicas mistas, muitas vezes misturando elementos de outros focos metodológicos.
4.1 Estudos de Participação Política A participação política e a expressão dos grupos nos
espaços da rede social é um dos primeiros exemplos que trazemos neste trabalho. Esta é uma das áreas que julgamos particularmente interessante, dada a influência das redes sociais (compreendidas aqui como os grupos sociais aos quais os indivíduos estão filiados em sua vida cotidiana) nos processos decisórios individuais (Salganic & Watts, 2009, por exemplo). Assim, se as ideias se espalham pelas redes sociais offline, como a interconexão da mídia social influencia esses processos online? Pode a mídia social promover formas diferentes de participação política e mesmo de exposição dos políticos? Pode a mídia social influenciar debates e decisões de voto?
47 Grupo de pesquisa em Mídia, Discurso e Análise de Redes Sociais http://www.midiars.net, coordenado pelos autores. 112
4.1.1 Twitter e Debates Eleitorais48 Neste primeiro exemplo, interessa-nos discutir como a ARS pode oferecer importantes insights para o estudo da participação política online, tomando como objeto as eleições presidenciais de 2014 e, de forma específica, os debates dos presidenciáveis. Assim, aplicamos a abordagem em estruturas sociais constituídas no ciberespaço, principalmente através dos sites de rede social e, de forma especial, ao Twitter durante os debates dos candidatos à presidência transmitidos pela televisão e pela internet em 2014. Nossa questão central aqui, portanto, está focada em como os candidatos repercutiram suas participações nos debates e o que podemos aprender a partir disso. Nossa proposta é explorar como podemos entender redes emergentes (de conversação) (Recuero & Zago, 2009; Recuero 2012) sobre os debates no Twitter e que tipo de indicativo essas redes trazem quando focamos a discussão nos presidenciáveis, através da análise de redes sociais. Focaremos, de modo específico em três medidas de centralidade, que consideramos relevantes para a análise do desempenho dos candidatos nas conversações na internet. A centralidade refere-se à uma medida relativa aos nós da rede e observaremos: grau, betweenness e eigenvector. Quando buscamos compreender o quão central é um determinado nó, estamos avaliando sua relevância para a rede. Também observaremos a 48 Parte dos resultados apresentados neste capítulo já foi apresentada em eventos, particularmente na ABCiber 2014.
113
posição do nó com relação ao grupo onde esse nó está, e, para separar os grupos, utilizaremos algoritmos de modularidade. Para os dados a seguir, utilizamos uma abordagem metodológica de coleta e outra de análise de dados. Os debates de 2014 que foram mapeados aconteceram em diferentes emissoras de TV e todos tiveram transmissão ao vivo pela internet. Para cada debate, selecionamos uma hashtag genérica e relacionada às narrativas dos debates em si (havia hashtags de cada candidato, propostas pela militância). Foram realizadas várias coletas de cada hashtag e, para a análise, utilizaremos dois momentos de cada debate. Outros detalhes sobre os eventos podem ser vistos na Tabela 1. 1) Debate da Band – Debate que aconteceu na rede Bandeirantes no dia 26/08/2014, terça-feira, às 22h, com duração de pouco mais de duas horas. Neste trabalho, analisaremos a hashtag “#DebatenaBand”. 2) Debate do SBT – Debate que aconteceu no SBT (Sistema Brasileiro de Televisão) no dia 01/09/2014, segunda-feira. Este debate aconteceu às 17h45min e durou, também, pouco mais de duas horas. Para a análise, focaremos nas redes através da hashtag “#DebatenoSBT”. Tabela 1: Dados das Redes coletadas nos debates
Hashtag #DebatedaBand
114
Rede 1 23:30
Rede 2 00:36
Total de nós do grafo
10288
5298
Total de conexões
14373
7066
Horário de coleta
23:30
00:36
Total de Tweets
18.000
7942
Hashtag #DebatenoSBT Total de nós no grafo Total de conexões Horário da Coleta Total de tweets
Rede 1 18:45
Rede 2 20:01
6711
7568
10.418
10891
18:45
20:01
20.000
20.000
A coleta de dados foi feita através do NodeXL, ferramenta que já foi detalhada no capítulo 3. Para este estudo, utilizamos duas coletas: Aquela realizada ao meio de cada debate e aquela realizada ao final. O objetivo, ao trabalhar com dois mapas, é tentar capturar um pouco melhor a dinâmica da rede de conversação em torno das hashtags, mostrando quais candidatos tomaram a frente e quais foram apenas marginalmente citados. A análise de dados foi feita utilizando também o NodeXL. Esta análise foca o perfil oficial dos candidatos. Assim, falaremos brevemente sobre outros nós que também têm posição proeminente na rede, mas nosso foco será, de modo específico, a posição dos candidatos na rede. A visualização dos dados, que será apresentada neste trabalho através de grafos, foi realizada com o NodeXL ou com o Gephi (também apresentado no capítulo 3). O primeiro debate aconteceu nas dependências da Rede Bandeirantes e foi transmitido ao vivo no site da emissora, às 22h do dia 26 de agosto. Durou cerca três horas e contou com a participação de Dilma Rousseff (PT, Coligação PMDB, PDT, PC do B, PP, PR, PSD, PROS e PRB), Aécio Neves (PSDB, Coligação PSDB, DEM, PTB, SD, PMN, PTC, PT do B, PEN e PTN), Marina Silva (PSB, Coligação PSB, PRP, PPS, PSL, PPL e PHS), Luciana Genro (PSOL), Pastor Everaldo (PSC) e Levy Fidelix (PRTB). Nesse debate, os primeiros blocos mostraram uma disputa maior
115
entre Aécio e Dilma, que até então estavam mais bem colocados nas pesquisas49 e uma menor concentração dessa disputa com Marina Silva. Na tabela a seguir (Tabela 2), apresentamos os dados gerais das redes coletadas. Os nós com maior centralidade são apresentados. Optamos por colocar os dez itens com maior valor dentro de cada métrica, para contextualizar, e os candidatos, caso estes não estivessem dentro dos mais centrais. Nenhum candidato ou conta de campanha apresentou outdegree relevante. Tabela 2: Dados Gerais do #DebatedaBand Rede 1 (23:35) Nós com maior diimabr indegree silva_marina
Número
Rede 2 (00:36)
Número
851
oglobopolitica
489
668
kibeloco
408
hugogloss
407
jeanwyllys_real
381
marcelotas
363
andrezinhop4
338
kibeloco
339
aecioneves
213
aecioneves
323
josiane_pmoraes
176
jooseanee
316
miltonneves
170
queremosaecio
227
mallandrosergio
150
gordinhooficial
221
joseanee
117
psdbparana
189
silva_marina
109
dilmabr
170
dilmabr
74
lucianagenro
101
lucianagenro
11
eduardojorge43
38
eduardojorge43
levyfidelix
17
levyfidelix
9 7
everaldo_20
18
everaldo_20
5
49 DataFolha de 18/08 - http://g1.globo.com/politica/eleicoes/2014/ noticia/2014/08/dilma-tem-36-marina-21-e-aecio-20-diz-pesquisadatafolha.html e a pesquisa que saiu na véspera do debate, já apontando Marina bem mais colocada na disputa: http://g1.globo.com/politica/ eleicoes/2014/noticia/2014/08/pesquisa-ibope-mostra-dilma-com-34e-marina-silva-com-29.html. 116
Nós com maior diimabr centralidade silva_marina betweenness hugogloss
13.777.692,23
oglobopolitica
12.402.328,76
aecioneves
3.387.307,653
jeanwyllys_real
3.297.258,298
kibeloco
3.211.095,346
5.669.266,76
aecioneves
5.588.911,419
marcelotas
5.474.887,93
andrezinhop4
4.993.547,891
1.516.155394
kibeloco
5.342.207.577
miltonneves
1.347.356,74
jooseanee
4.967.467,811
silva_marina
1.025.230,204
queremosaecio
2.984.559,315
jooseanee
989.301,675
dilmabr
2.443.521,167
comentv
921.954,975 643.168,370
dilmarousselff
2.195.434,539
dilmabr
lucianagenro
1.304.898,972
lucianagenro
eduardojorge
320.056,394
eduardojorge43
everaldo_20
121.547,404
everaldo_20
levyfidelix
107.736,552
levyfidelix
0,025349
aecioneves
Nós com maior aecioneves centralidade maisaecio eigenvector rede 45 (candidatos e contas de campanha)
0,023713 0,002528
85.835,981 75.926,00 28.351,169 14,00 0,011685
Na tabela, observamos que, no início do debate, a candidata Marina Silva é a mais citada e com maior centralidade betweenness, seguida pelo candidato Aécio Neves. Dilma vem a seguir e, depois, Luciana Genro. Eduardo Jorge, Pastor Everaldo e Levy Fidélix têm pouquíssimas citações. Entretanto, ao observarmos a centralidade eigenvector, vemos que o candidato Aécio é o único a aparecer, juntamente com contas de apoio, indicando possivelmente uma articulação entre essas contas. Ao observarmos também a centralidade betweenness, vemos que é Marina quem aparece com maior número de pontes, sendo citada junto a grupos diferentes. Logo a seguir, temos Aécio e Dilma, mas ambos com uma centralidade bem inferior. Neste primeiro grafo (Figura 22), vemos a rede do primeiro momento do debate articulada em torno do indegree e plotada através do algoritmo ForceAtlas 2.
117
Figura 22: Grafo do primeiro momento no debate da Band.
118
Vemos, nessa primeira imagem, que, enquanto Marina Silva se situa mais ao centro do grafo, próxima de Dilma Rousseff e Luciana Genro, Aécio Neves distanciase, aproximando-se de outros clusters, indicando de forma mais clara que o candidato é citado em contextos diferentes e por contas diferentes dos demais. Esse afastamento, bem como os dados anteriores, reforçam a hipótese de que o candidato Aécio aparece com centralidades altas pela ação de sua militância principalmente, mais do que pelas citações orgânicas com relação ao debate. Além disso, seu afastamento também implica em clusterização com nós diferentes, enquanto os demais candidatos, com citações mais orgânicas, aparecem próximos uns dos outros (condizendo com a narrativa do debate).
O grafo está colorido por modularidade, indicando vizinhança (tendência de nós com vizinhos iguais ficarem no mesmo grupo). Ao observarmos o gráfico a seguir (Figura 23), construído por grupos dento do algoritmo de ClausetNewman-Moore e separados os clusters, temos outro desenho que auxilia a compreender melhor o momento. Em verde, temos a candidata Marina, em azul, Aécio e no cluster laranja, os demais candidatos.
Figura 23: Grupos
É relevante observarmos também a importância das contas fake de apoio à candidata (e presidenta) Dilma, como @diimabr (a «Dilma Bolada) e @dilmarousselff (a “Dilminha), que também aparecem com boa centralidade betweenness e alto indegree fora do cluster de @dilmabr, atingindo pessoas diferentes e repercutindo em grupos diferentes.
119
120
No segundo momento do debate, já temos dados diferentes (Tabela 2). O candidato Aécio sobe e todos os demais caem. É relevante observar que a centralidade betweenness dele e de Marina são as mais altas entre os candidatos indicando provavelmente um crescimento de citações dos candidatos em grupos diferentes em relação aos demais (mas uma possível perda de articulação que existia no início do debate, já que esses números diminuíram). Quando vemos os grafos (Figura 23), há também outro desenho. Novamente, o grafo mostra o candidato Aécio Neves mais afastado, com Marina Silva também um pouco mais afastada do centro. Outros atores ganham maior centralidade. Curiosamente, o candidato a deputado do PSOL Jean Wyllys torna-se mais central que a própria candidata ao governo do partido, Luciana Genro. No segundo grafo, também separado por cluster de acordo com o algoritmo de Clauset-Newman-Moore, vemos novamente que os candidatos aparecem mais em um contexto conjunto (com exceção de Eduardo Jorge, que está separado). Entretanto, ainda é possível ver a articulação em torno do candidato Aécio, com o conjunto de conexões azuis que o liga a contas de campanha que repercutem seu nome (Figura 24). É importante observar nesses dados, também, a presença de uma única conta jornalística (oglobopolitica) e de uma grande quantidade de contas humorísticas (como as de Dilma, @kibeloco e etc.), indicando a relevância deste tipo de narrativa na conversação. Vemos, assim, que neste debate, a posição central foi inicialmente ocupada por Marina Silva, logo a seguir sendo ultrapassada por Aécio. É importante observar, também , a articulação em torno do candidato Aécio e os perfis falsos que acabam
também popularizando a conta de Dilma. Entre os candidatos menos falados, Luciana Genro manteve-se em quarto lugar, com Eduardo Jorge a seguir.
Figura 24: Grafo do segundo momento do #debatedaband.
O segundo debate aconteceu nas dependências do SBT (Sistema Brasileiro de Televisão) e foi transmitido ao vivo pelo SBT, pela UOL e pela Folha de São Paulo online. Iniciou às 17h45min do dia 01 de setembro de 2014, uma terça-feira e terminou por volta de 20h da mesma data. Estiveram no debate os mesmos candidatos do debate anterior. O debate teve seus primeiros blocos concentrados em um duelo mais acirrado entre as candidatas Dilma Rousseff e Marina Silva, provavelmente por conta da pesquisa do DataFolha50, divulgada alguns dias antes, que apontava esta última como um risco real à reeleição de 50 http://www1.folha.uol.com.br/poder/2014/08/1508270-marinaempata-com-dilma-na-corrida-presidencial-diz-datafolha.shtml.
121
Dilma, com um empate entre as duas e um crescimento grande das intenções de voto na última, além de uma queda de Aécio. Os últimos blocos foram caracterizados por críticas mais acirradas à Dilma por parte de Aécio e Marina, além de críticas à Marina, por todos os candidatos. O candidato Eduardo Jorge repercutiu muito por seus posicionamentos e atitudes durante o debate, roubando um pouco o palco principal em algumas participações51, Levy Fidelix e Luciana fizeram uma participação semelhante à do primeiro debate (Figura 25).
Figura 25: Grupos do segundo momento do #debatedaband
Como no debate anterior, utilizamos o procedimento de crawling do NodeXL, obtendo os dados das redes co-
51 A íntegra do debate está disponível em: http://www.sbt.com.br/ jornalismo/noticias/44352/Assista-na-integra-ao-debate-entre-oscandidatos-a-Presidencia-.html#.VAhvl2RdU0Y. 122
letadas às 18h45min (meio do debate) e às 20h (final do debate). Os dados são sumarizados a seguir (Tabela 3). Tabela 3: Dados Gerais do #DebatedoSBT
Rede 1 (18:45)
Número
Rede 2 (20:00)
Nós com maior dilmarousselff indegree diimabr
765
william_castro
762
silva_marina
558
aecioneves
449
rafinhabastos
466
maisaecio
358
diimabr
292
eduardopcardoso
339
dilmarousselff
193
joaquimtdasilva
193
aecioneves
190
nostrendsbrasil
178
dacostaneusa
177
walteerfelix
163
ivaniaaziz
170
william_castro
158
jooseanee
155
rede45
148
dilmabr
144
dilmabr
124
levyfidelix
111
silva_marina
109
lucianagenro
lucianagenro
73
everaldo_20
19
everaldo_20
29
eduardojorge43
15
levyfidelix
14
eduardojorge43 Nós com maior diimabr centralidade dilmarousselff betweenness aecioneves
1.346
60
7 7.585.658,256 silva_marina 6.829.852,311 rafinhabastos 2.410.933,143 diimabr
7.276.268,225 5.835.159,29 3.608.187,751
rede45
1.688.704,421 aecioneves
2.415.509,889
maisaecio
1.450.405,368 dilmarousselff
2.204.489,026
dilmabr
1.162.560,183 dilmabr
1.426.666,127
silva_marina
827.035,2512 aecioblog
1.137.863,483
aecioblog
681.406,9495 levyfidelix
1.059.050,8
lucianagenro
616.456,610 lucianagenro
825.496,6513
everaldo_20
112.467,183 eduardojorge43
125.996,2999
levyfidelix
79.336,257 everaldo_20
eduardojorge43
41.959,546
Nós com maior aecioneves centralidade eigenvector
0,025349
maisaecio
0,023713
rede 45
0,002528
68.423,237
Nenhum candidato apresentou dados significativos
No primeiro mapeamento deste debate, observamos o indegree dos perfis dos candidatos. Vemos, assim,
123
que o candidato com maior indegree é o candidato Aécio Neves. A seguir, situam-se as candidatas Dilma e Marina. Isso indica que o candidato foi o mais citado por outras contas durante o primeiro momento do debate. Ao observarmos, entretanto, as métricas seguintes, de centralidade betweeness e eingenvector, vemos também que Aécio tem uma alta centralidade, bastante superior à dos demais candidatos. As candidatas Dilma e Marina aparecem entre os maiores nós com centralidade betweenness, mas bem abaixo de Aécio. À primeira vista, parece que o candidato Aécio Neves foi aquele que dominou a conversação na rede. Entretanto, ao observarmos com maior cuidado, percebemos que suas contas de campanha também aparecem em todas as métricas. Há, aqui, um forte indício da ação de um único cluster entre si, fazendo com o que o candidato apareça entre os mais citados. Ao observarmos o grafo, essa situação fica mais clara (Figura 26).
Figura 26: Mapa do segundo momento do debate
124
Observamos um cluster em torno do nome do candidato Aécio, mostrando com maior clareza que há uma articulação forte em torno de seu nome (em vermelho, acima). Já as candidatas Dilma, Marina aparecem de forma mais orgânica na rede, sendo citadas por atores diferentes, ao centro, dentro do cluster verde claro. Assim, no caso de Aécio, vemos várias contas de apoio que também aparecem com um indegree e betweenness altos, indicando possivelmente uma estratégia de campanha para elevar a visibilidade do candidato. É importante observar também e como no caso do debate anterior a presença forte das contas de humor e, especialmente, das contas que apoiam Dilma, repercutindo em grupos onde o nome oficial não aparece. No segundo mapa, a seguir (Figura 27), vemos os grupos separados por clusters (Clauset-NewmanMoore). Os grupos indicam quais contas estão mais próximas de quais candidatos, pelas citações e retweets. Vemos as contas de Dilma, Levy e Luciana num mesmo cluster (laranja), indicando comentários a sua participação no bloco feitos por várias contas, de forma semelhante ao grafo anterior. Ou seja, mais tweets/contas que citaram Dilma citaram também os outros dois candidatos. A conta de Marina aparece mais próxima do Pastor Everaldo (cluster vermelho), também indicando a ocorrência de ambos em conjunto nos tweets. Eduardo Jorge (cluster verde) e Aécio (cluster azul) aparecem em outros clusters, indicando que aqueles que citaram esses candidatos pouco citaram os demais. O cluster do candidato Aécio é o mais fechado, com menor número de citações externas para outros clusters.
125
Figura27: Grupos do primeiro momento do debate no SBT.
No segundo momento, ao final do debate, já vemos outro desenho. Na tabela 3, vemos um crescimento da candidata Marina, em indegree e betweenness, que se coloca mais ao centro do grafo (figura Aécio Neves cai, apesar de ainda ocupar posição central e ficar mais próximo dos candidatos Levy Fidélix e Dilma Rousseff, que crescem). Na figura 28, vemos o grafo geral por indegree. Observamos também que, de forma diferente do grafo anterior, há menos centralização e maior densidade. Isso indica uma maior participação das pessoas, bem como outras contas sendo protagonistas na narrativa.
126
Figura 28: Cluster do segundo momento do debate no SBT
Ao observarmos os clusters por grupos, na Figura 29, vemos contextos de conversa diferentes. Enquanto os clusters maiores se referem-se a tweets humorísticos narrando o debate dos usuários @william_castro e @rafinhabastsos, vemos que os três candidatos mais centrais estão no mesmo cluster, porque foram citados pelos mesmos usuários (provavelmente aqueles que narravam o debate) e também foram citados em conjunto. Já os demais candidatos, Luciana, Levy e Eduardo aparecem separados em outros clusters, sendo citados por grupos diferentes.
127
Figure 29: Grupos do segundo momento do debate no sbt.
Conforme vimos até aqui, na primeira medida do debate, o candidato Aécio Neves ocupava uma posição mais central na discussão, tanto por ação de militância, quanto por ação de contas de campanha. No segundo momento, essa centralidade passa a ser dominada por Marina Silva, que se torna a candidata mais citada. Também é relevante observar que os três candidatos se tornam mais próximos no decorrer do debate, provavelmente aparecendo em contextos de narrativas do debate em si. Entretanto, é importante fazer um aparte: Apesar de a candidata Dilma não aparecer com tanto foco em nenhuma das análises, os perfis falsos que a divulgam, @diimabr (a “Dilma Bolada”) e @dilmarousselff (a “Dilminha”) ocupam posições centrais e com indegree alto em ambas as redes. Isso significa que, apesar da conta da presidenta não estar tão central no grafo, há um espalhamento de 128
sua “persona” por outros grupos, notadamente aqueles conectados às contas de humor. Essa visibilidade pode fazer diferença, na medida em que chega a pontos da rede diferentes daqueles da conta oficial da candidata. Luciana Genro perde um pouco de espaço na segunda metade, e Eduardo Jorge cresce na segunda coleta. A partir dos dados coletados, é possível traçar alguns apanhados estratégicos a respeito de como estão sendo citados e em quais contextos e suas estratégias de campanha. Observamos, por exemplo, que alguns candidatos têm citações mais orgânicas (o que não quer dizer que não tenham militância, mas que a militância não atua em torno do seu nome especificamente ou não atua com a hashtag do debate), enquanto outros, como Aécio Neves, têm citações consistentes e focadas em um mesmo grupo de atores (bots ou militância) que cita apenas sua conta. Desse modo, a centralidade betweenness é capaz de identificar influência entre diferentes esferas de grupos. Vimos que, entre os candidatos, em relação a esse índice, destacam-se, no primeiro debate, Marina Silva e Aécio, seguidos, com um número inferior, por Dilma. No segundo debate, temos Aécio e Dilma, com Marina em terceiro no início, mudando depois para Aécio, Marina e Dilma. Isso significa que os dois candidatos, Aécio e Marina tendem a atuar mais como pontes do que Dilma, ou seja, ser citados em tweets pertencentes a atores que não estão próximos entre si, o que indicaria um apoio mais difuso, orgânico, pois os nós são mais eficientes em unir diferentes grupos (Hansen, Shneiderman& Smith, 2011). Entretanto, ao mesmo tempo, também observamos que o candidato que aparece em citações mais orgânicas é Dilma, quando observamos os grupos por modularidade. É
129
130
ela, também, que aparece mais próxima dos demais, indicando contextos de citação onde os demais candidatos também aparecem (narrativas do debate). Vimos também que o único candidato a aparecer com centralidade eigenvector relevante é Aécio. A campanha de Aécio Neves parece utilizar um conjunto de contas que apoiam e atuam narrando a presença do candidato nos debates, citando-se e retuitando-se entre si também. Com isso, as contas de campanha têm um indegree alto, contribuindo diretamente para o aumento da centralidade eigenvector da conta oficial. Aqui, a métrica pode representar prestígio (Rusinowska et. al, 2011), mas especialmente entre um grupo específico de atores que também são atuantes nas redes - no caso, as contas de campanha e apoiadores. Sendo intencional ou não, a atuação desses atores contribui para elevar as demais métricas de citação, posicionando Aécio melhor durante o debate e tornando-o mais visível para as audiências. Marina Silva também tende a aparecer separada dos demais candidatos, em um contexto no qual as contas não falam das demais. Sua centralidade parecer ser mais orgânica, ou seja, há menos militância e mais conversação em torno de seu nome, ao contrário do caso anterior. No primeiro debate, Marina começa muito citada e com alta centralidade betweenness (o que é esperado devido à circunstância da indicação de seu nome), logo a seguir, no segundo momento, caindo bastante. No segundo debate, Marina começa discreta e cresce, também tanto em citações quanto em centralidade. Ambos os dados indicam uma maior oscilação da candidata, ao contrário dos candidatos anteriores, provavelmente mais relacionado à organicidade de suas relações. Observamos também que
modularmente Marina também tende a aparecer próxima de outros atores, indicando também seu contexto de narrativa do debate. Ela desloca-se sempre para grupos próximos a outros candidatos (clusters), indicando aí contextos de participação onde repercute mais. A exceção a esse tipo de presença extrema é a conta de Dilma, que aparece sempre mais conectada aos demais candidatos, possivelmente aparecendo de forma mais comparativa, já que é a atual presidenta e a candidata a ser batida (que está em primeiro lugar nas pesquisas). Apesar da presença discreta da conta oficial da candidata, entretanto, é essencial observar a atuação central das contas fakes que trazem um perfil positivo da candidata, que obtêm grande visibilidade durante o debate (@ diimabr e @dilmarousselff). Essas contas atingem grupos que a militância e as narrativas dos debates não atingem (aparecendo em clusters separados). Além disso, essas contas estão dentro do discurso humorístico que parece ganhar bastante espaço durante os eventos. Luciana permanece sempre em quarto lugar em termos de citações e centralidade. Em alguns casos, entretanto, seus apoiadores aparecem muito mais do que ela, como é o caso do deputado Jean Wyllys, do PSOL, que narrou o debate da Band obtendo mais destaque do que a candidata. Entretanto, como no caso de Dilma, tal narrativa é relevante, pois demonstra apoio à candidata, repercutindo em redes onde seu nome não apareceu com tanta força. Também é importante observar a presença de Eduardo Jorge no primeiro debate e a queda de visibilidade do candidato no segundo, sendo suplantado por Levy Fidélix e Pastor Everaldo. Esses candidatos, que tendem a aparecer e repercutir em grupos separados dos candi-
131
datos com maior apoio, também aparecem, mas de forma menor. Levy adquire maior centralidade no segundo debate, mas ainda de forma discreta em relação aos candidatos com maior intenção de voto. Neste exemplo, buscamos extrair informações que fossem relevantes para a análise das campanhas eleitorais e do desempenho dos candidatos nos debates através da ARS. Nosso foco foi, principalmente, não só nas métricas de centralidade, que vimos no capítulo 2, como também a descrição da coleta e visualização de dados do capítulo 3. Nesse exemplo, utilizamos diretamente análise de redes sociais para compreender a estrutura de redes de hashtags e redes de conversação diante de debates televisivos. Vimos como as principais métricas de ARS podem auxiliar nessas discussões, montando redes que podem mostrar vinculações partidárias, atuação de grupos e mesmo, mudanças de discurso. A seguir aprofundaremos um pouco mais as questões de discurso, com mais alguns exemplos.
4.2 Estudos de Discurso Mediado por Computador e Redes Sociais
132
A mídia social, em suas características de públicos em rede (boyd, 2010) e de esfera pública, também é um espaço de produção, circulação e legitimação de discursos. Assim, enquanto os atores determinam quais informações serão reproduzidas, quais serão reverberadas, quais receberão visibilidade e quais serão debatidas, eles também produzem e reproduzem diferentes discursos. Neste subcapítulo, discutiremos alguns dos principais
elementos para que possamos compreender esse discurso, seus efeitos e como estudá-lo a partir das ideias de análise de redes que discutimos neste livro. O conceito talvez mais conhecido de discurso mediado por computador é aquele de Herring (2001). Para a autora, o estudo da comunicação mediada por computador tem um foco importante na linguagem e na linguagem em uso e, a partir destes, no uso de métodos de análise do discurso para compreender essas práticas. Androutsopolos & Beisswenger (2008) explicam que o discurso mediado por computador compreende todos os tipos de “mensagens interpessoais” transmitidas pelas ferramentas da internet (como chats, sites de rede social e etc.). Esses conceitos têm em comum o fato de focarem no produto linguístico da mediação do computador, analisando o discurso como restrito a esse produto, sua forma e suas particularidades enquanto objeto. Esse grupo preocupase em analisar principalmente os efeitos da mediação do computador sobre a linguagem. Apesar disso, em trabalhos posteriores, onde há propostas metodológicas, também há um foco no sentido da mensagem (Herring, 2004; 2013) como algo que está construído dentro de um foco semântico posterior. De outro lado, entretanto, há outros conceitos de discurso. Neste trabalho, utilizamos a definição de discurso de Michel Foucault, sendo que este é compreendido como “o domínio geral de todas as afirmações, algumas vezes como um grupo individualizado de afirmações, outras vezes, como uma prática regulada que reflete um número de afirmações” (Foucault, 1999, p.80).O discurso é, para o autor, um conjunto de linguagem e prática, que constrói e governa um determinado tópico. Hall (2001)
133
134
explicita que o discurso é visto como um sistema de representações para Foucault, imbuído de práticas que vão produzir o conhecimento sobre um determinado tema. Essas práticas são delimitadas, regradas e legitimadas pelo discurso. Assim, o discurso “constrói o tópico” e delimita o modo através do qual algum tópico pode ser “conversado e discutido” (p.72). As práticas discursivas são filiadas a determinadas “formações discursivas” (Foucault, 1999, 2009). Essas formações serão discutidas adiante e referem-se a regularidades de apresentação do discurso que se refere a um mesmo objeto ou tema, a uma mesma forma de dizer ou forma de criar sentido. Essas formações discursivas são evidências de uma ideologia que está expressa através do discurso. O efeito dessa repetição das formações é construir conhecimento e naturalizar o discurso. O conhecimento produzido pelo discurso, por sua vez, também é responsável pelas regras de exclusão do que não pode ser dito. Essa naturalização está relacionada à percepção de certos argumentos do discurso como verdades (normas) e à marginalização de outros argumentos. Assim, as falas que não estão adequadas às normas impostas pelo discurso são excluídas, desacreditadas e silenciadas (Hook, 2001). Em sentido semelhante, Bourdieu (1991) foca as trocas linguísticas como “relações de poder simbólico”, ou seja, momentos em que as relações de poder (e dominação) entre os falantes são atualizadas (p. 37). O discurso, assim, é uma imposição dos dominantes sobre os dominados que reconstrói e determina as estruturas da dominação e legitima a ordem social vigente. A linguagem tem, assim, uma força simbólica na construção e estruturação
da realidade, que vai ser resultante das relações de força entre essa linguagem e a imposição do sentido. É neste “campo linguístico” que vão ser expressas essas relações de força estabelecidas pela linguagem (Bourdieu, 1991, 1998), que constituem também as disputas simbólicas de que trataremos aqui. O poder, ainda, é exercido e desafiado pelo discurso. Entretanto está também disfarçado nas práticas discursivas, de modo a manter a dominação através da legitimação da hegemonia. Observamos, portanto, que as falas que são constituídas nos sites de rede social e que ali permanecem e circulam também estão submetidas às relações de poder e ideologia que constituem os sujeitos desses discursos. E, com isso, podem traduzir também elementos-chave para a compreensão dessas dominações. Assim, percebemos o discurso online como também produzido dentro de terminadas condições históricas que reproduzem condições de produção do espaço offline. As instituições que estão offline também influenciam as redes sociais online e vemos os públicos mediado também como um espaço de reprodução e legitimação das relações de poder do espaço offline. Assim, é também um espaço de naturalização (e desafio) do discurso, de produção de conhecimento e desafio deste conhecimento. Esses estudos são particularmente relevantes se tomarmos a ideia que apresentamos na introdução, da mídia social como esfera pública onde a participação dos atores tem efeitos sobre a produção e a circulação dos discursos que constituem a “opinião pública”. Estudos de discurso na mídia social podem focar a frequência de conceitos, palavras e suas co-ocorrências.
135
É possível usar métodos que misturem, por exemplo, análise de co-ocorrências, análise de conteúdo e análise textual. 4.2.1 Racismo e Xenofobia on-line: Caso das Eleições 2014 Os dados a seguir foram coletados do Twitter através das palavras-chave “Nordeste” e “nordestinos”, imediatamente após a publicação dos resultados das eleições 2014, quando Dilma Rousseff foi reeleita presidenta da República, no dia 26 de outubro de 2014. Os dados foram coletados através do NodeXL nos dias 27 e 28 de outubro e correspondem a 36.600 tweets únicos. Uma vez coletados os dados, buscamos extrair os tweets, que foram objeto de uma análise de co-ocorrência ou análise de contingência (Osgood, 1959), que é parte da abordagem de Análise de Conteúdo (Krippendorf, 2012). Neste método, objetiva-se tratar o texto através de uma análise de conteúdo, em que o foco está na construção de conceitos pela frequência de palavras/termos e suas co-ocorrências, ou seja, a ocorrência conjunta dos mesmos conceitos na mesma unidade. Isso significa alguns procedimentos:
1) Determinação da unidade de análise na qual será analisada a co-ocorrência de conceitos (por exemplo, uma frase, um parágrafo, um conjunto de textos);
136
2) Contagem da frequência de palavras e sua classificação em conceitos de acordo com o conjunto de dados;
3) Análise de co-ocorrência desses conceitos, verificando-se, no conjunto de dados, a tendência de determinados conceitos a ocorrer em grupo, ou conectados. A partir desses procedimentos, é possível assim montar uma rede e proceder à análise do ponto de vista da ARS, pois obtém-se uma matriz de dados onde os conceitos representam os atores, e suas co-ocorrências, as conexões. No caso do Twitter, determinamos nossa unidade de análise como sendo o tweet em si. Assim, as co-ocorrências podem dar pistas sobre os sentidos construídos pelos discursos divulgados e difundidos no Twitter nos momentos após a eleição. Para legitimar os dados, também observamos os tweets mais retuitados do corpo de dados e buscamos aqueles que continham os conjuntos de conceitos com maior saliência. É importante salientar também que não retiramos do corpo de dados os tweets repetidos ou retuitados, justamente porque consideramos o retweet como um reforço da mensagem propagada. Para analisar esses dados, usamos as métricas de grau e modularidade. Os nós da rede representam os conceitos, que foram agregados por sinônimos e plurais (por exemplo, “pessoa”e “pessoas”; “ganhou” e “venceu”). Assim, as conexões entre os conceitos representam suas co -ocorrências e o tamanho da palavra, seu grau (frequência no conjunto total). As cores representam os módulos ou grupos aos quais as palavras estão associadas (ou seja, conjuntos de conceitos que estão mais diretamente conectados entre si, que tendem a aparecer mais conec-
137
tados). A ideia central é que essas conexões, a presença de determinados conceitos e a ausência de outros podem dar pistas sobre os discursos que estão presentes com maior força e que talvez se propaguem, no momento da análise, com maior frequência na ferramenta.
Figura 30: Rede de co-ocorrências dos dados
138
O primeiro grafo desses conceitos aparece a seguir (Figura 30). Ao centro do grafo, temos os conceitos mais conectados aos tweets, ou seja, aqueles que mais apareceram. Vemos, assim, o conceito “Nordeste” como um dos mais centrais, conjuntamente com “Dilma” e “voto”. É interessante também observar a oposição, no mesmo grupo, no conceito “Sudeste”. Também diretamente associa-
do a “Nordeste” temos outro módulo, que sempre aparece junto com dois conceitos “bolsa” e “família”. Na Figura 30, vemos os principais conceitos e suas relações (conceitos com grau igual ou superior a 100) conceito “Nordeste” ao qual são associados os principais xingamentos “burros”, “ignorantes” e “pobres”. Ao mesmo tempo, o “Sudeste” também é associado à discussão, dentro do mesmo módulo, indicando que a comparação entre o eleitor de cada região foi um dos itens mais fortemente colocados. Outros conceitos fortemente associados são “voto”, “Dilma” e “burros”, “pobres” e “povo”. O conceito de bolsa família também aparece conectado mais fortemente a “pobres”, “burros”, “Dilma” e “Nordeste”. É interessante também observar o outro módulo, constituído por “preconceito”, “redes sociais” e “regiões”. Esse módulo aparece quando as notícias relacionadas aos tweets preconceituosos e agressivos entre eleitores das regiões sul e sudeste versus norte e nordeste começaram a circular. É importante observar que, ao analisar os dados de forma completa, podemos ver claramente que os conceitos relacionados a qualificações aparecem mais próximos do “Nordeste”, indicando sua utilização para qualificação dos nordestinos. Esse dado mostra o que está latente, ou seja, ideias que não necessariamente estão entre os tweets mais retuitados, mas que aparecem de forma mais uniforme no conjunto de dados. Assim, o voto em Dilma é associado ao nordeste (onde estão os “burros”, os “pobres” e a “bolsa-família”) e esse voto é comparado ao sudeste. Tweets que evidenciam essas relações no conjunto de dados, por exemplo, são:
139
“Nordestinos não sabem votar.” “Dilma liderando no Nordeste. Nordestinos burros, se vendem por bolsa-família.” “Nordeste votar na Dilma: LIXOS, burros, não sabem votar, cretinos, bolsas escola!” “O nordeste não são só os burros.”
É interessante observar que, mesmo quando os tweets trazem um contraponto, ainda assim eles associam os conceitos e reproduzem as críticas aos nordestinos, ou seja, reproduzindo ainda o discurso negativo. “Os nordestinos são mais inteligentes que o resto do Brasil por estarem votando na dilma e ainda levam a fama de burros.” “Paulistas chamando nordestinos de burros por terem votado na Dilma. Queria entender pq acham inteligente votar no governador.”
Quando observamos os dados normalizados, vemos mais fortemente quais mensagens mais circularam e os discursos mais fortes. Na Figura 31, vemos esses grupos, separados por cor e com a espessura das conexões representando a força das mesmas. Quanto mais espessa, maior o número de co-ocorrências.
140
Figura 31: Módulos normalizados de co-ocorrências mais frequentes.
Na Tabela 6, vemos os grupos com mais de três conceitos conectados, o que nos dá uma percepção dos grupos de palavras mais comumente conectados do corpo de dados. Tabela 6: Módulos da Rede com mais de três nós
Módulo
Principais Conceitos Associados
1
Dilma, Nordeste, Aécio, Sudeste, brasileiros, vergonha, democracia, voto, vida, marina, água, política, poder, nada, boa, tudo, crítica.
2
Maluf, tiririca, garotinho, filho, russomano, massa, povo, bolsonaro, feliciano, eleição, crítica, atraso.
3
Alvo, racismo, engraçado, vitória, ninguém, regiões, puta, boca.
4
redes sociais, grotões, preguiçosos, revoltados
5
FHC, discurso, força, coxinhas, amor
6
seca, morte, acéfalos, burros, culpa, pau
7
amigos, guerra,cretina, corrupção, lábia
8
governo, lula, mídia
141
9
cultura, muita, grande, economia
10
desgraça, medo, merecem
11
imundo, tucanos, irmãos
12
partido, pobres, negros
13
ameaça, direita, américa, novo, merda
14
deus, bom, nunca, escola
15
maior, esmola, bola, família, porra
A seguir, mostraremos, dentre os tweets com mais de 50 retweets no conjunto de dados (o máximo foi de 468 reproduções), algumas mensagens que exemplificam estes módulos. Ao centro, vemos “Dilma”, “Nordeste”, “vergonha”, “brasileiros”, “democracia”, “voto”, “maioria”, “Aécio”, “sudeste”, “água”. Esse grupo representa os conceitos que mais apareceram em conjunto, que especificamente se referem a tweets que criticavam os paulistas pelos tweets contra os nordestinos, comentando sobre democracia, voto, e principalmente, sobre a falta de água em SP. Exemplos: “Nordestinos são alvo de racismo nas redes sociais após a vitória de Dilma.” “Revoltados, eleitores disparam contra nordestinos no Twitter.”
No módulo 2, os tweets referem-se à crítica feita aos moradores da região sudeste pelos nordestinos ofendidos, focando a eleição de políticos. Exemplo de tweets mais retuitados neste módulo: 142
“SP elegeu Russomano e Feliciano, RJ elegeu Bolsonaro e Clarissa Garotinho, SP elegeu Espiridião Amin. E o nordeste que não sabe votar.” “Esse povo do nordeste não sabe votar, dizem os paulistas que votaram em massa em Tiririca, Russomano, Telhada, Feliciano.”
Os módulos 3, 4, 6, 7 e 15 referem-se explicitamente a críticas aos nordestinos, por terem “eleito” Dilma, inclusive com ofensas pessoais à presidenta eleita. Dentro deste módulo, estão tweets bastante retuitados como: “Nordestinos não sabem votar.”
“Nordestinos burros elegem Dilma.” “Pau no cu desse povo do nordeste que votaram na Dilma. Tudo mendigando bolsa familia.” “BORA TRABALHAR PRA SUSTENTAR ESSES NORDESTINOS.”
Também neste módulo, mesmo tweets que fazia ressalva, acabam reproduzindo o discurso. “Eu não sou obrigada a ver acéfalos chamando nordestinos de burros, não generalizem, grata.” “Pq a pessoa que deseja que ‘nordestinos morram na seca’ não compra logo uma passagem pra SP pra cada um deles?”
O módulo 6 representa tweets particularmente agressivos, que desejam a morte aos eleitores de Dilma. 143
“Seus nordestinos malditos que votaram na dilma, morram!” “EU SOU DO NORDESTE, MAS ESSES NORDESTINOS QUE VOTARAM NA DILMA MERECIAM MORRER MESMO MORRE DESGRAÇA.”
O tweet anterior, por exemplo, foi retuitado várias vezes. Por um lado, retuitavam pessoas que concordavam com a mensagem. Por outro, pessoas reproduziam o tweet com um comentário ridicularizando-o. “Seus nordestinoWWs malditos que votaram na dilma, morram!/deletou o tweet o cagão.”
O módulo 12 buscou discutir o ódio aos nordestinos comparando-o com as manifestações contra negros e pobres. Os módulos 8 e 9 referem-se a tweets comparando Dilma e Lula e a política econômica. Finalmente, os módulos 5 e 13 referem-se a tweets sarcásticos ou ofensivos contra os “eleitores de direita”, como o a seguir: “Atenção nordestinos e brasileiros em geral: eleitores de direita racistas no caminho.”
144
A partir dessa análise, podemos ver o discurso e o contra-discurso no Twitter sobre o ódio aos nordestinos. É interessante observar que, mesmo quando as pessoas tentam desconstruir o discurso de ódio, elas citam as referências (nordestinos-burros-acéfalos etc.), auxiliando a tornar mais forte essa relação nos dados. Ou seja, no ato de desconstrução, termina-se por dar ainda mais visibilidade aos ditos negativos.
Essas práticas podem ocorrer pela próprio estrutura conversacional do Twitter (onde o retuite e a cópia da mensagem são comuns), bem como pelas características dos públicos em rede (boyd, 2010), como a replicabilidade e a escalabilidade dessas mensagens. Especialmente pelo fato de que é tão simples copiar exatamente a mensagem publicada pelo ator, sua escalabilidade é alta, atingindo uma grande quantidade de nós da rede. Essas conexões entre conceitos nos auxiliam a perceber nuvens de sentido mais amplas que são reconstruídas e propagadas nessas ferramentas. Essas relações constituem-se em elementos de violência simbólica (Bourdieu, 1991), mesmo quando buscam comentar, pois acabam dando mais visibilidade à agressão original. Assim, no debate, reforça-se o constructo de que os “nordestinos” são “assim” ou “assado”, reforçando estereótipos (como a questão da seca, da pobreza e da raça), aumentando a percepção da xenofobia e insuflando o ódio (por exemplo, nas respostas contrárias, igualmente agressivas). Parece-nos que essas fortes conexões entre os conceitos nos discursos traduzem e reforçam formações discursivas (Foucault, 1999, 2009) presentes nos tweets, que são reproduzidos e constituem-se em ideias e associações que são reforçadas e naturalizadas (Bourdieu, 1991) na sociedade. Essa facilidade de reprodução também pode ter um forte impacto na agressividade que se evidencia nessas ferramentas. A própria reprodução do discurso negativo por aqueles que o desejam discutir, ou desconstruí-lo tem efeitos na rede como um todo. Ao mesmo tempo, a facilidade com que tais mensagens encontram eco e são reproduzidas na mídia social também evidencia elemen-
145
tos relacionados a discursos racistas e xenófobos que, por vezes, acredita-se que não mais existam. Esses discursos, ao contrário, parecem estar latentes, mas presentes na sociedade. O que torna esses estudos mais relevantes ainda é que outros trabalhos têm demonstrado a capacidade de influência (inclusive, danosa para os processos democráticos (Tufecki, 2014) da mídia social sobre processos decisórios (Bond et al., 2012), especialmente devido à aproximação de pessoas e a sua atuação na manutenção dos laços sociais. Os mecanismos da influência das mensagens na mídia social na opinião pública, entretanto, ainda não são completamente claros. Nesta sessão mostramos como é possível, através da análise de redes sociais, observar formações discursivas e discursos presentes na mídia social. Esses estudos podem relacionar-se a percepções variadas, tais como estudos de sentimento com relação a determinados contextos, valores, marcas e etc. Aqui trouxemos apenas um exemplo, com o objetivo de proporcionar a visualização de como esse trabalho pode ser feito.
4.3 Jornalismo e Mídia Social52 Uma prática emergente no campo do jornalismo é o jornalismo guiado por dados (Träsel, 2014). Tratase de um campo de atuação que requer um conjunto de habilidades específicas para lidar com grandes quantidades de dados. Para tanto, Träsel (2013) sugere que a for-
52 Partes dos resultados discutidos nesta seção já foram apresentadas em eventos, particularmente ABCiber 2014 e Ibercom 2015.
146
mação jornalística seja complementada com técnicas de pesquisa científica (estatística e pesquisa social), informática avançada (para lidar com planilhas) e noções de programação. Para a visualização desses dados, podem ser usados infográficos, que envolvem a combinação de informação com outras formas de visualização de dados (Cairo, 2012). Há dificuldades em se mostrar grandes quantidades de dados de uma forma fácil de entender (para quem não teve acesso aos dados originais). O infográfico aparece como uma alternativa interessante, na medida em que não se limita apenas a informações textuais para passar a mensagem. Com relação às técnicas de pesquisa necessárias, podem-se obter informações estatísticas básicas sobre os dados, mas apenas despejar um monte de dados não é uma pesquisa científica. É importante fazer um recorte. Esse recorte envolve uma decisão no sentido de decidir como responder à seguinte questão - o que perguntar aos dados? Mesmo que se tenham grandes quantidades de dados, é importante contextualizar as informações - e isso vai se dar através de técnicas como a apuração jornalística (Viríssimo, 2009). Também é importante saber combinar dados qualitativos com dados quantitativos - um monte de dado não significa nada se não tiver uma boa explicação por trás. Dentre outras atividades possíveis, o jornalismo guiado por dados pode envolver o uso de técnicas de análise de redes sociais para medir sentimentos e relações entre atores sociais. Dois exemplos podem ser dados com especiais produzidos durante a Copa do Mundo
147
de 2014 no Brasil. No primeiro caso, o site Apita Brasil53, uma parceria entre a Bloom Digital Research, a Huia, e o Scup, procurava mostrar, em tempo real, os temas mais comentados pelos brasileiros em sites de rede social sobre o mundial. Já o especial “Copa do Mundo no Twitter” da Revista Veja54 buscava fazer uma análise de sentimento em tempo real para avaliar tweets sobre os jogadores do Brasil na Copa. A relação do jornalismo com ARS também aparece em projetos voltados para análise de redes sociais de notícias, como no Projeto Overview, da Associated Press55, voltado para a visualização de notícias a partir da relação entre termos que aparecem nas notícias, e o News Explorer do Europe Media monitor56, que busca estabelecer relações entre as fontes mencionadas nas notícias. Esses aplicativos geram grafos que podem ser analisados a partir de ARS. No Projeto Overview, os termos são os nós e a co-ocorrência entre eles nas mesmas notícias representam as conexões. No caso do News Explorer, os nós são as fontes que aparecem nas notícias, e as conexões são estabelecidas a partir das notícias em que aparecem juntas. A Análise de Redes Sociais também pode ser utilizada para compreender a estrutura da circulação de informações jornalísticas (Zago, 2014). A circulação pode ser estudada a partir de relações entre os conteúdos postados, ou entre indivíduos que colocaram em circulação postagens abordando desdobramentos de 53 Disponível em: . Acesso em: 14 jun. 2014. 54 Disponível em: . Acesso em: 14 jun. 2014. 55 http://overview.ap.org. 56 http://emm.newsexplorer.eu/NewsExplorer/home/en/latest.html.
148
notícias. Essa abordagem permite não só identificar nós centrais na circulação de determinados acontecimentos jornalísticos, bem como o quão centrada em determinados nós está a rede. Diferentes estruturas podem ser observadas ao se analisar acontecimentos jornalísticos de natureza diferente. Malini (2011) sugere que há dois tipos de cobertura colaborativa nas redes: a cobertura emergente e a cobertura programada. Enquanto a cobertura programada envolve a articulação por um veículo de um acontecimento que já está sendo discutido, a cobertura emergente surge em torno de um determinado acontecimento que ainda não recebeu destaque na mídia tradicional. A seguir, trazemos dois casos relacionados à Copa do Mundo de 2014 no Twitter. No primeiro caso, uma cobertura programada, observa-se a rede em torno do uso da hashtag #EstadaonaCopa, proposta e utilizada pelo jornal Estado de S. Paulo para postagem de notícias durante a Copa. No segundo caso, observa-se uma cobertura emergente, a partir de tweets que buscavam identificar o jogador Lukas Podolski, da Alemanha, como brasileiro. 4.3.1 Cobertura programada: #EstadaonaCopa
O jornal Estado de S.Paulo utilizou a hashtag #EstadãonaCopa antes, durante e após a Copa do Mundo de 2014 para se referir à cobertura do evento esportivo. A hashtag foi usada pelo jornal em diversos sites de rede social, como Twitter, Facebook e Instagram. Por ser usada pelo veículo, a hashtag também foi utilizada por usuários que interagiam com o veículo, seja
149
através de retweets ou de menções. O próprio veículo promoveu iniciativas de participação do público com o uso da hashtag, como no caso de pedir que os leitores postassem fotos de seus álbuns da Copa no Instagram com a hashtag #estadaonacopa57. O Estadão não foi o único a propor uma hashtag própria durante a Copa. Outras hashtags de veículos podem ser citadas, como #FolhanaCopa, do jornal Folha de S.Paulo, #GauchanaCopa, da rádio Gaúcha, e #NaCopaZH, do jornal Zero Hora. A coleta de dados foi realizada em 14 de junho de 2014 usando a ferramenta NodeXL, já apresentada no capítulo 3. A coleta foi realizada às 09h51min e compreende um período de quase 24 horas, entre às 12h24 do dia 13 de junho e às 09h34 do dia 14 de junho. Ao todo foram obtidas 2.005 conexões (relações de menção ou retweet) e 1.338 nós (autores dos tweets e usuários mencionados ou retuitados) a partir de tweets contendo a hashtag #EstadaonaCopa. No conjunto de dados referentes à hashtag #EstadaonaCopa, ao todo foram identificados 24 componentes, sendo que 15 possuem uma única conexão. O componente com maior número de nós possui 1.299 nós interligados entre si por relações de menção ou retweet. Por se tratar de uma rede em torno de uma hashtag específica, o número de componentes é bastante reduzido. A maior parte dos nós (1.299 de um total de 1.338 nós, o que corresponde a 97% o total) está incluída em um único com57 “Leitores mostram sua coleção de figurinhas #EstadaoNaCopa”, Dentro da Rede, 18 abr. 2014. Disponível em: . Disponível em: 30 jul. 2014. 150
ponente ao redor do perfil principal no Twitter do jornal, @estadao. A densidade do grafo é de 0,000897755 (o número vai de 0 a 1). No recorte, o maior indegree é 1.255 (número de menções recebidas). O maior outdegree é 7 (número de tweets feitos). As hashtags mais presentes no conjunto de dados são, obviamente, #EstadãonaCopa, em 1.182 tweets, e #EstadaonaCopa, em 513 tweets. Esse resultado era esperado tendo em vista se tratar de uma rede centrada em torno de uma hashtag específica. Outras hashtags aparecem em menor quantidade, todas elas associadas a times de futebol, como #NED com 448 menções, #ESP, com 447 menções, #CHI com 107 menções e #AUS com 107 menções, o que traz indícios de que o veículo utilizou as hashtags oficiais das seleções no Twitter durante a sua cobertura da Copa. Dentre os usuários com maior indegree no recorte (Tabela 7), além do predomínio óbvio de @estadao, outros atores aparecem, como @dilmabr, @neymarjr e @cristiano, personagens citados nas manchetes do jornal publicadas no microblog, ou @necromorty, @fitzca e @meiaseis, usuários que fizeram retweets ao jornal contendo a hashtag. Usuário @estadao @dilmabr @necromorty @fifaworldcup @neymarjr @cristiano @fitzca @estadaoesporte @meiaseis @geraldoalckmin_
Número de menções 1.255 127 40 22 19 18 18 11 10 8
Tabela 7: Nós mais centrais no recorte (maior grau de conexão indegree).
151
Um exemplo de retweet ao usuário @necromorty contendo a hashtag #EstadãonaCopa pode ser visto abaixo: RT @Necromorty: ¿#MundialBrasil2014? (VÍA @Estadao) Artefato explode próximo à Câmara de Vereadores #EstadãonaCopa #VzlaViveElFutbol
Já nos exemplos a seguir, podemos ver retweets de atualizações do jornal com menções aos atores envolvidos na notícia (@dilmabr no primeiro caso, @neymarjr e @Cristiano no segundo): RT @fitzca: ÓLEO DE PEROBA: ‘Isso não me enfraquece nem me abate’, diz @dilmabr após vaias http://t.co/zS4qmDs0bN #EstadãonaCopa
RT @Estadao: .@neymarjr supera média de gols de Messi e @ Cristiano Ronaldo http://t.co/WE6MgChWlr #EstadãonaCopa
A visualização da rede (Figura 32) foi gerada no Gephi usando o layout ForceAtlas – mais informações sobre este layout podem ser encontradas no capítulo 3. Os nós estão coloridos por modularidade. O tamanho do nó representa o indegree – quando maior o nó, mais conexões (menções ou retweets) o usuário recebeu. Os pontos isolados ao redor do grafo representam usuários que postaram tweets sem mencionar outros usuários em suas publicações.
152
Figura 32: Grafo da rede de tweets, retweets e menções com a hashtag #EstadaonaCopa nos dias 13 e 14 de junho de 2014.
Esse grafo possui uma estrutura bastante peculiar, uma vez que está bastante centrado num único usuário (@estadao, no centro). Há pouquíssimos nós desconectados (pontos isolados nas bordas do grafo). Ele possui uma estrutura com um núcleo central com usuários que mencionaram o jornal @estadao mais de uma vez no período (dois ou mais retweets). Já os usuários que mencionaram o veículo apenas uma vez aparecem na parte externa do cluster. O pequeno cluster acima, à esquerda, na parte externa do grafo (estrutura parecida com uma aranha), corresponde a retweets ao usuário @meiaseis, que usou a hashtag, porém não mencionou o perfil do jornal Estadão em seu tweet. Dentro do grafo principal, é possível identificar tweets com menção a @dilmabr em verde, @ necromorty em vermelho, e @fifaworldcup em amarelo.
153
Por se tratar de uma cobertura programada – proposta por um veículo e utilizada pelo público para referenciar esse veículo –, a estrutura da rede permite identificar um cluster central em torno do @estadao. 4.3.2 Cobertura emergente: Podolski brasileiro
O segundo caso analisado se refere a uma cobertura emergente. O acontecimento tomado como estudo se refere à ideia surgida na internet de que o jogador Lukas Podolski, da seleção alemã, seria brasileiro. O jogador, de origem polonesa, destacou-se por fazer postagens em português recheadas de gírias nos sites de rede social. Com isso, os usuários passaram a se referir a ele como “brasileiro”. Embora tenha iniciado nas redes (emergente), o acontecimento sofreu mutações ao ponto de se transformar em um acontecimento tradicional, noticiado por veículos diversos, incluindo meios tradicionais como a televisão. Desde antes de começar a Copa, a seleção alemã não mediu esforços para se sentir em casa no Brasil. Dentre as iniciativas, os alemães construíram seu próprio hotel58 para a concentração do time, bem como passaram por atividades diversas com locais, como vestir camiseta do Flamengo, fazer festa com índios, ou torcer pelo Brasil59. 58 “Alemanha desaprova hotéis e decide erguer casa na Bahia”, Veja, 13 dez. 2013. Disponível em: . Acesso em: 14 ago. 2014. 59 “Nove motivos para a seleção alemã ser considerada a mais legal da Copa”, UOL, 04 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 154
No caso específico de Podolski, o jogador contou com ajuda de um amigo brasileiro para fazer postagens em português em seus perfis no Facebook, Instagram e Twitter60. As postagens em português do jogador deram origem a um meme associando o jogador à nacionalidade brasileira, como em tweets iniciados por “Podolski tão brasileiro”61. Também foram criados perfis fakes associados ao jogador, como @podolskii1062 e @podolskison1063. No perfil @podolskison10, pode-se ler a seguinte descrição: “Vim pro Brasil e mudei o meu nome para Podolskison!”. Ainda que tenha se originado nas redes, o acontecimento se desprendeu do ciberespaço e virou objeto de notícia em inúmeros outros espaços, mesmo após a Copa, incluindo uma reportagem no programa Fantástico, da Rede Globo, em 20 de julho de 201464, uma semana após o término do evento esportivo. Sua carta de agradecimen60 “Com postagens em português, amigo torna Podolski fenômeno de carisma”, Globo Esporte, 10 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 61 “Declarações de Podolski sobre amor ao Brasil viram memes nas redes sociais”, Superesportes, 11 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 62 O usuário mudou o perfil para @Podolskil0 após a Copa. Disponível em: . Acesso em: 14 ago. 2014. 63 Disponível em: . Acesso em: 14 ago 2014. 64 “‘Animação do povo brasileiro me conquistou’, diz Podolski”, Fantástico, 20 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014.
155
to ao país, postada no Twitter, em português, no dia 14 de julho de 2014, obteve mais de 22 mil retweets65 e também virou notícia66. A construção desse acontecimento traz peculiaridades, na medida em que o processo não envolveu um único ato ou situação. O acontecimento foi sendo construído, de forma emergente, a partir de inúmeros desdobramentos ao longo de toda a Copa. O recorte aqui utilizado consiste em um conjunto de tweets em torno do fato de o jogador Podolski ser considerado brasileiro. A coleta de dados foi realizada no dia 13 de julho de 2014 usando a ferramenta NodeXL. Os dados foram obtidos às 21h03min e compreendem um período de cerca de uma hora e meia, entre às 19h32min e às 20h58min. Ao todo foram obtidas 2.999 conexões (relações de menção ou retweet) e 2.707 nós (autores dos tweets e usuários mencionados ou retuitados) a partir de tweets contendo os termos “podolski” e “brasileiro”. No conjunto de dados referentes ao caso do Podolski brasileiro, ao todo foram identificados 340 componentes, sendo que 202 possuem uma única conexão. O componente com maior número de nós possui 2.297 nós interligados entre si por relações de menção ou retweet. Diferentemente do caso anterior, há um maior número de componentes, o que significa que a rede estava menos centrada em poucos indivíduos. 65 Disponível em: . Acesso em: 14 ago. 2014. 66 “‘Queridinho” dos brasileiros, alemão Podolski posta carta agradecendo país”, UOL, 14 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 156
A densidade do grafo é de 0,0003679, ou seja, trata-se de uma rede bem menos densa que a da hashtag @ EstadaonaCopa. No recorte, o maior indegree é 546 (número de menções recebidas). O maior outdegree é 6 (número de menções e retweets feitos). As hashtags mais presentes no conjunto de dados são #Podolski, em 551 tweets, #aha, em 546 tweets, #BRALEMANHA, em 544 tweets, #SabeDeNadaInocente, em 544 tweets e #ChupaMessi em 216 tweets. As hashtags #aha e #SabeDeNadaInocente foram usadas pelo próprio jogador no Twitter, o que ajuda a explicar sua popularidade na rede sobre o caso. Dentre os usuários com maior indegree no recorte (Tabela 8), é possível observar o próprio jogador (@podolski10), dois fakes (@podolskii10 e @podolskison10), e alguns perfis de humor. Usuário
@podolskii10
Número de menções 546
@gabrieldread
341
@futmusica
184
@podolski10
150
@itsmarquinho
129
@duduh_jk
114
@podolskison10
84
@leifederal
82
@luanlovato
77
@noahczerny
74
Tabela 8: Nós mais centrais no recorte (maior grau de conexão indegree).
O tweet com maior número de retweets no recorte foi feito pelo fake @podolskii10 e encontra-se reproduzido a seguir: 157
A taça do mundo é nossa sou Brasileiro não há quem possa ! #BRALEMANHA #aha @SabeDeNadaInocente #Podolski
Essa atualização utiliza uma combinação de hashtags usadas pelo jogador em tweets anteriores em seu perfil próprio (@podolski10), como nos exemplos a seguir: Alô #Rio cheguei hein, obrigadão pela recepção, muito cativante essa energia positiva do povo brasileiro #flAlemanha #SabeDeNadaInocente61 Ja estou tão acostumado com o #Brasil que já estou até assistindo novela #Noveleiro #CoraçãoVerdeAmarelo #Brasil #poldi #aha62
67 68 O site de definições de hashtags #tagdef define a hashtag #aha como uma “piada interna entre os jogadores do Arsenal. Um barulho que Lukas Podolski faz”69. A visualização da rede (Figura 33) foi gerada no Gephi. Os nós estão coloridos por modularidade. O tamanho do nó representa o indegree – quando maior o nó, mais conexões (menções ou retweets) o usuário recebeu.
67 Fonte: “Podolski posta sobre “sabe de nada, inocente” no RJ e recebe pedidos de casamento”, UOL Esporte, 12 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 68 Fonte: “Praia, novela e apoio ao Brasil: por que Podolski é o jogador alemão favorito dos brasileiros”, Zero Hora, 11 jul. 2014. Disponível em: . Acesso em: 14 ago. 2014. 69 Tradução de: “Inside joke of Arsenal London players. A noise Lukas Podolski makes”. Disponível em: . Acesso em: 14 ago. 2014.
158
Os pontos isolados ao redor do grafo representam usuários que postaram tweets sem mencionar outros usuários em suas publicações.
Figura 33: Grafo da rede de tweets, retweets e menções a Podolski brasileiro no dia 13 de julho de 2014.
O maior módulo, em preto, está centrado no fake @ podolskii10. O segundo maior módulo, em tons de cinza, ao lado do módulo maior preto, refere-se ao usuário @gabrieldread. Abaixo do módulo preto, é possível observar um módulo em tons de cinza centrado em torno do usuário @ futmusica, e, ao lado deste, um módulo centrado em torno de @luanlovato. Essa rede apresenta como particularidade alguns módulos com mais de um hub simultaneamente. Esse 159
é o caso do módulo localizado na parte inferior direita do grafo, que inclui os usuários @podolski10 e @itsmarquinho, e do módulo na parte superior direita do grafo, que representa os usuários @leifederal e @podolskison10. Esses módulos híbridos aparecem por conta da natureza dos tweets postados pelos usuários, podendo conter duas ou mais menções simultaneamente. Nesses dois casos em específico, trata-se do mesmo tweet, porém em um dos casos, a referência é feita a um dos fakes do jogador, e, no outro caso, é feita referência ao perfil oficial do jogador, como pode ser visto abaixo: RT @LeiFederal: n° 3.297, de 2014 Foi concedido o Título de Cidadão Honorário Brasileiro, ao Jogador Lukas Podolski (@ podolskison10 ) pelo “#ChupaMessi”64 RT @itsmarquinho: n° 3.297, de 2014 Foi concedido o Título de Cidadão Honorário Brasileiro, ao Jogador Lukas Podolski (@ Podolski10 ) pelo “#ChupaMessi”65
70 71 Essa diferença na atribuição do retweet e da fonte pode ser situada em um contexto de economia do retweet (Recuero & Zago, 2012). O retweet pode ser considerado uma moeda de troca no Twitter. Assim, conceder ou receber um retweet confere valor ao usuário mencionado, em especial em termos de visibilidade na rede. Aquele que é referenciado como fonte da informação tem sua imagem ou nome de usuário visto em outros perfis da rede. Essa economia do retweet é reforçada pela limitação de caracteres do Twitter, que só permite 140 toques. Diante disso, surge uma tensão entre os usuários, entre mencionar 70 https://twitter.com/LeiFederal/status/488461658936061952. 71 https://twitter.com/Stalkializei/status/488465003218219009. 160
o perfil que originalmente criou a informação ou aquele que por último a repassou. Mesmo tendo iniciado nas redes (a partir das postagens em português do próprio jogador), o acontecimento recebeu visibilidade jornalística, o que contribuiu para aumentar a repercussão do caso. Ao ser narrado no Twitter, o acontecimento foi sendo (re)construído a partir da cooperação entre usuários e veículos. Nesta seção, abordamos possibilidades de aplicações de análise de redes sociais para o jornalismo, como no caso do mapeamento da cobertura no Twitter a partir de hashtags ou palavras-chave. Dois tipos de cobertura foram analisados, uma cobertura programada com a hashtag #EstadãonaCopa e uma cobertura emergente em torno de o jogador Podolski ser considerado brasileiro. É possível perceber semelhanças e diferenças entre os dois casos estudados e suas estruturas de rede. As diferenças aparecem principalmente em termos de modularidade, grau e densidade e variam conforme o tipo de cobertura mapeada. Enquanto no primeiro caso a modularidade é menor, o maior grau de conexão é maior (ou seja, a rede está mais centrada em um único usuário), e a densidade é menor (há mais interconexão), no segundo caso é possível observar uma modularidade maior, um maior número de centros com alto grau de conexão indegree e uma densidade menor, o que demonstra uma maior fragmentação da rede. Essa é apenas uma das possibilidades de aplicação da análise de redes sociais ou jornalismo. Como vimos, outras possíveis abordagens envolvem análise de sentimento, estudo de fontes de notícias, dentre outros campos de estudo.
161
* * *
A partir de estudos feitos no âmbito do Grupo de Pesquisa MIDIARS, este capítulo procurou ilustrar três possibilidades de aplicação da análise de redes sociais no contexto da mídia social: movimentos políticos, discurso e jornalismo. Esses exemplos buscam “traduzir” um pouco do que discutimos nos capítulos anteriores para os leitores, especialmente como traduzir as métricas para casos reais e quais tipos de informações podem ser inferidas desses elementos.
162
À guisa de conclusão: O Campo Nosso objetivo com este livro foi trazer um conjunto de elementos básicos para que estudantes, pesquisadores e demais interessados pudessem familiarizar-se com a análise de redes sociais como método para o estudo da mídia social. Com um interesse cada vez maior na abordagem72, e com confusões estabelecidas com outras perspectivas (como por exemplo, entre a ARS e a Teoria Ator-Rede de Latour73), achamos que uma obra introdutória seria interessante e necessária. Para iniciar esta discussão, portanto, trouxemos alguns conceitos básicos a respeito do que compreendemos como mídia social e suas características e relações para o estudo através da ARS. Logo a seguir, fizemos uma breve introdução com explicação dos conceitos principais e, finalmente, um capítulo focado na aplicação desses conceitos com exemplos práticos. O esforço deste livro, assim, busca popularizar a abordagem da ARS para os es72 Neste âmbito, um conjunto cada vez maior de artigos e investigações baseadas na temática é observado desde 2012, com destaque especial para as pesquisas focadas em elementos de sites de redes sociais (vide, por exemplo, anais dos principais eventos da área da Comunicação, bem como a BRASNAM, workshop promovido pela SBC focado em análise de redes sociais). 73 Sobre esta discussão, vide Bastos, Zago e Recuero (2014).
163
tudos de mídia social, bem como suas aplicações para os pesquisadores brasileiros. Diferentes grupos hoje, de áreas tão diferentes como Computação, Sociologia, Comunicação, Linguística Aplicada, Ciência da Informação e etc. têm experimentado com a abordagem, em busca da compreensão os fenômenos a partir de suas estruturas. O surgimento da mídia social e o foco no objeto dos rastros digitais tanto pelas ciências sociais e humanas quanto pelas ciências exatas gerou novas áreas de trabalho, mais interdisciplinares, onde diferentes métodos são agregados para dar conta dos fenômenos. Através da utilização de ferramentas computacionais e métodos mistos, quantitativos e qualitativos, toda uma nova área de trabalho vem sendo construída, no limite de diversas áreas antes mais fortemente separadas, focada em dados empíricos reais e sua análise para explicar fenômenos contemporâneos. E é neste nascedouro que acreditamos que este livro pode contribuir e auxiliar os interessados neste campo.
164
Posfácio Computação Social: Desafios para cooperações Interdisciplinares Fabricio Benevenuto
Há uma questão relacionada à ciência da computação que é tão antiga quanto a própria área: computação é realmente uma ciência? Os críticos em geral veem a computação como engenharia ou matemática e não como uma ciência genuína [1]. Seja ela criticada ou aceita como ciência, os avanços na computação permitiram uma nova onda de sistemas que eram inimagináveis há pouco tempo. Não é incrível existir um sistema como o Facebook com mais de um bilhão de usuários ativos? Não é incrível a quantidade de vídeos que o YouTube consegue armazenar, recuperar e exibir simultaneamente? Pra se ter uma ideia, o que o YouTube recebe de conteúdo em alguns dias seria suficiente para suprir tudo o que já foi transmitido em toda história da Rede Globo [2]. Pra mim a ciência da computação alcança o seu maior potencial quando abordada de forma interdisciplinar. Mas toda cooperação precisa ser uma via de mão dupla. No caso, a computação pode ser usada como meio para responder as questões de outras áreas, mas a própria
165
166
computação pode se desenvolver dentro de outras áreas. A bioinformática é um exemplo claro de sucesso em que a biologia se beneficia dos grandes arcabouços computacionais e de algoritmos eficientes e que, ao mesmo tempo, fez a computação evoluir com novos algoritmos ainda mais eficientes e arcabouços computacionais ainda mais robustos para que a área como um todo pudesse avançar. No caso da cooperação entre as ciências sociais e da computação, há também uma via de mão dupla a ser explorada. Muitos cientistas sociais atualmente querem investigar ou já investigam dinâmicas de comportamentos sociais através de simulações sociais, ou através de análises de mídias e de redes sociais. Tudo isso requer coleta de dados e análises através de um arcabouço computacional que naturalmente sugere cooperações interdisciplinares. Já na computação muitos acreditam que as redes sociais surgiram há menos de uma década. Em uma disciplina que leciono no Departamento de Ciência da Computação da UFMG costumo apresentar aos alunos um periódico da sociologia que eles nunca ouviram falar, chamado Social Networks e que existe desde 1978. A computação não pode simplesmente negligenciar algumas décadas de conhecimento e calcar seus estudos apenas nos próprios trabalhos. O esforço interdisciplinar retira um cabresto natural que nós pesquisadores temos e nos permite enxergar melhor as questões relevantes de um tema de pesquisa tão amplo como as redes sociais. Muitas vezes existem questões científicas relevantes nas mãos do cientista da computação, que não são sequer percebidas se o viés abordado for puramente o viés da computação. Em 2009 e 2010, durante um período em que eu trabalhei no Instituto Max Planck, na Alemanha, resolve-
mos estudar como informações se propagam no Twitter e como um usuário é capaz de influenciar outros usuários nesse sistema. Fizemos uma coleta de todos os usuários existentes no Twitter e de todos os seus tweets. Do ponto de vista da computação nosso esforço era muito válido, visto que esse tipo de medição fornece os subsídios para a criação de novos métodos para se identificar usuários influentes, um problema que nós mesmos abordamos poucos anos depois. Mas a grande diferença desse trabalho é que nós revisamos diversos trabalhos relacionados de outras áreas do conhecimento. Havia várias teorias, muitas difíceis de serem validadas nos confins de um laboratório. Nosso trabalho foi talvez o primeiro a trazer uma perspectiva diferente para o tema com contribuições interdisciplinares, pois medimos um conceito subjetivo com dados reais e apresentamos como as coisas acontecem em um sistema como o Twitter. De maneira geral, grandes contribuições na computação estão associadas à construção de algoritmos, modelos e sistemas inovadores. Nosso esforço dentro de uma área que começamos a chamar de computação social está em medir e analisar interações e comunicações entre usuários de redes sociais visando modelar tais comportamentos sociais e, a partir disso, construir novos algoritmos e sistemas. Em outras palavras, nosso esforço consiste quase sempre em medir como as coisas acontecem nesses sistemas e buscar inspiração nesse conhecimento extraído dos dados para propor novos algoritmos para esse contexto ou mesmo propor novos sistemas computacionais. Foi assim com o trabalho sobre influência [3] e propagação de informação no Twitter [4,5], em que o conhecimento extraído a partir das medições resultaram
167
168
em estratégias para se identificar usuários influentes [6] e em um sistema de busca de usuários experts em determinados assuntos no Twitter[7]. Há uma infinidade de problemas na computação que podem se beneficiar dessa visão sem o cabresto de uma única área do conhecimento. Como exemplo, um tema quente hoje na computação é análise de sentimentos, que consiste em se extrair opiniões e identificar sentimentos expressos em pequenos trechos de texto. Isso pode ser útil, por exemplo, para determinar se um texto fala bem ou mal de determinado assunto, que pode ser um produto, um serviço, ou até mesmo uma pessoa. De uma maneira simplista, as estratégias computacionais para fazer análise de sentimentos consistem em elaborar uma sequência de etapas objetivas, validadas experimentalmente, para medir o que é naturalmente subjetivo. Obviamente, existem diversos estudos na psicologia ou mesmo na linguística que podem impulsionar os estudos desenvolvidos dentro do âmbito da computação. Negligenciá-los é como não fazer ciência da forma correta. Felizmente, já existem esforços no Brasil e no exterior no sentido de tentar facilitar a colaboração entre essas duas áreas. Um esforço interessante é o International Conference on Web and Social Media (ICWSM), que tem conseguido unir pesquisadores da computação e da humanas. Pra acomodar diferentes objetivos que esses pesquisadores possuem há diferentes formatos de submissão. Um deles é o que é normalmente usado na computação, onde os artigos que são aceitos pelo comitê técnico são apresentados na conferência e publicados nos anais do evento. Mas há um formato em que os artigos são devidamente avaliados pelo comitê técnico e se acei-
tos são apenas apresentados no evento, para que possam ser publicados originalmente em algum periódico posteriormente. Há ainda outras conferências interessantes com esforços semelhantes, como a Conference on Online Social Networks (COSN) e o Web Science Conference. Há ainda um evento nacional, o Brazilian Workshop on Social Network Analysis and Mining (BraSNAM), que eu coordenei em 2013 e 2014. Trata-se de um evento com caráter interdisciplinar e cujo comitê de programa é instruído a aceitar trabalhos cuja contribuição não está na computação. Além disso, há sempre um esforço de convidarmos palestrantes e painelistas para o evento que realizam contribuições no tema, porém com um viés diferente da computação. O BraSNAM foi até então um sucesso em termos de número de trabalhos submetidos, qualidade dos trabalhos publicados e audiência durante os eventos. Em ambas as edições o evento aconteceu como parte da principal conferência nacional da computação, a conferência da sociedade Brasileira da Computação (CSBC) e obviamente há um maior engajamento muito maior de pesquisadores e alunos da computação. O desafio atual é promover o evento fora da computação para que o evento não apenas reúna a comunidade nacional interessada no tema, mas passe a servir como fórum para discussões e estabelecimento de cooperações interdisciplinares. Apesar dessas e de várias outras possibilidades, as colaborações entre humanas e computação são ainda bastante modestas na prática. Algumas dificuldades realmente existem por uma série de pequenos fatores, mas que não deveriam ser nenhum empecilho. Por exemplo, na computação os veículos de publicação de maior impacto são conferências e não periódicos. A inscrição em uma
169
conferência da computação possui custo muito alto, o que normalmente não acontece em outras áreas. Há a questão do Qualis para a publicação conjunta de pesquisadores de ambas as áreas. Acredito que o mais importante para o pesquisador envolvido com as redes sociais é ter em mente que da mesma forma que as ciências humanas podem se beneficiar da computação como meio para responder importantes questões de pesquisa, a computação pode explorar o conhecimento da área da humanas para inspirar seus algoritmos e sistemas. * * *
170
[1] Denning, P. J. The science in computer science. Communications of the ACM 56.5 (2013): 35-38. [2] https://www.youtube.com/yt/press/statistics.html. [3] Cha, M. et al. Measuring User Influence in Twitter: The Million Follower Fallacy. ICWSM 10.10-17 (2010): 30. [4] On Word-of-Mouth Based Discovery of the Web. Rodrigues, T.; Benevenuto, F.; Cha, M.; Gummadi, K.; Almeida, V. In: Proceedings of the 11th ACM SIGCOMM/USENIX Internet Measurement Conference (IMC’11), Berlin, Germany, November 2011. [5] The world of connections and information flow in Twitter. Cha, M.; Benevenuto, F.; Haddadi, H.; Gummadi, K. In: IEEE Transactions on Systems, Man and Cybernetics - Part A. Volume 42, Number 4. July 2012. Pages 991998. [6] Finding Trendsetters in Information Networks. Saez-Trumper, D.; Comarela, G. Almeida, V.;
Baeza-Yates, R.; Benevenuto, F. In: Proceedings of the 18th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD’12). Beijing, China. August 2012. [7] Cognos: Crowdsourcing Search for Topic Experts in Microblogs. Ghosh, S.; Sharma, N.; Benevenuto, F.; Ganguly, N.; Gummadi, K. In: Proceedings of the Annual Int’l SIGIR Conference (SIGIR’12). Portland, USA. August 2012. * * *
Fabrício Benevenuto é professor adjunto do Departamento de Ciência da Computação (DCC) da Universidade Federal de Minas Gerais (UFMG) e membro afiliado da Academia Brasileira de Ciências. Ele obteve seu doutorado em Ciência da Computação pela UFMG em 2010 com a tese vencedora do prêmio Capes de Teses. Fabrício foi pesquisador visitante no HP research Labs em Palo Alto/CA e no Instituto Max Planck na Alemanha. Seus projetos atuais visam desenvolvimento de técnicas de análise de sentimentos e de sistemas Web sociais, temas nos quais tem produzido um grande número de artigos amplamente citados.
171
172
Referências
AMARAL, A. Redes sociais de música: Segmentação, Apropriações e Práticas de Consumo. Revista ComCiência, 2010. Disponível em: http://www.comciencia.br/comciencia/handler.php?section=8&edicao=59&id=748. Acesso em: 20 ago. 2013. ANDROUTSOPOULOS, J.; BEIßWENGER, M. Introduction: Data and methods in computer-mediated discourse analysis. Language@Internet, v.5, 2008. Disponível em: . Acesso em: 8 jan. 2015. BACKSTROM, L.; BOLDI, P.; ROSA, M.; UGHANDER, J.; VIGNA, S. Four degrees of separation. Proceedings of WebSci’12. New York: ACM, 2012, p. 33-42. BAKSHY, E. et al. The role of social networks in information diffusion. Proceedings of the 21st international conference on World Wide Web. Lyon, France: ACM, 2012, p. 519-528. BASTOS, M. T. Medium, Media, Mediação e Midiatização: A Perspectiva Germânica. In M. Â. Mattos, J. Janotti Junior & N. Jacks (Orgs.), Mediação e Midiatização (v. 12, p. 5377). Salvador: EDUFBA, 2012. BASTOS, M. T. ; ZAGO, G. S. ; RECUERO, Raquel . Encontros e Desencontros entre TAR e ARS: O Laço Fraco entre Teoria e Método. Contemporanea (UFBA. Online), v. 12, p. 1-15, 2014. BENEVENUTO, F. Redes Sociais Online: Técnicas de Coleta, Abordagens de Medição e Desafios Futuros. In: A.C.M. PEREIRA; G.L. PAPPA; M. WINCKLER; R.L. GOMES (orgs.),
173
Tópicos em Sistemas Colaborativos, Interativos, Multimidia, Web e Banco de Dados. Belo Horizonte, Sociedade Brasileira de Computação, p. 41-70, 2010. Disponível em: http:// homepages.dcc. ufmg.br/~fabricio/download/mini-curso-swib10.pdf. Acesso em: 20 ago. 2013. BENHABIB, S. Models of Public Space, Habermas and the Public Sphere. Cambridge: MIT press, 1992. BLONDEL, V. D.; GUILLAUME, J. L.; LAMBIOTTE, R.; LEFEBVRE, E. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, P10008, n.10, 2008. BONACICH, P. Factoring and weighting approaches to status scores and clique identification. Journal of Mathematical Sociology, n. 2, n. 1, 1972, p. 113-120. BORGATTI, S. P.; BRASS, D. J.; HALGIN, D. S. Social network research: Confusions, criticisms, and controversies. In: BRASS, D. J., LABIANCA, G., MEHRA, A., HALGIN, D. S., BORGATTI, S. P., (Orgs.) Research in the Sociology of Organizations, v. 40. Emerald Publishing: Bradford, UK, 2014. BORGATTI, S. P.; MEHRA, A.; BRASS, D.; LABIANCA, G. “Network Analysis in the Social Sciences.” Science, v.323, n.5916, p.892-895, 2009. BORGATTI, S. P., LOPEZ-KIDWELL, V. Network Theory. In SCOTT, J.; CARRINGTON, P.J. (Orgs.). The SAGE handbook of social network analysis. London: SAGE Publications, 2011. BOURDIEU, P. Language and Symbolic Power. Massachusetts: Harvard University Press, 1991. BOURDIEU, P. The forms of Capital. Originalmente publicado em “Ökonomisches Kapital, kulturelles Kapital, soziales Kapital” In: Soziale Ungleichheiten (Soziale Welt, Sonderheft 2). Goettingen: Otto Schartz & Co. 1983. (p. 98-183). Traduzido para o inglês por Richard Nice. Disponível em . Acesso em: 23 fev. 2005. 174
BOYD, D.; CRAWFORD, K. Critical Questions for Big Data. Information, Communication & Society, v. 15, n. 5, p. 662679, 2012/06/01 2012. Disponível em: . Acesso em: 2012 dez. 2013. BOYD, D.; ELLISON, N. B. Social Network Sites: Definition, History, and Scholarship. Journal of Computer-Mediated Communication, v. 13, n. 1, 2007. BOYD, D. Social Network Sites as Networked Publics: Affordances, dynamics, and implications. In: PAPACHARISSI, Z. (Org.). Networked Self: Identity, Community, and Culture on Social Network Sites, p. 39-58, 2010. BRIN, S.; PAGE, L. The anatomy of a large-scale hypertextual Web search engine. Proceedings of the seventh international conference on World Wide Web, v. 7, p. 107-117, 1998. Disponível em: . Acesso em 8 jan. 2015. BRUNS, A. Gatewatching, not gatekeeping: Collaborative online news. Media International Australia Incorporating Culture and Policy: quarterly journal of media research and resources, v. 107, p. 31-44, 2003. BURT, R. The Social Structure of Competition. In: Structural Holes. Cambridge, MA: Harverd University Press, 1992. BURT, R. S. Structural holes versus network closure as social capital. In: LIN, N.; COOK, K.; BURT, R. S. (Orgs.). Social Capital: Theory and Research, p. 31-56, New York: Aldine de Gruyter, 2001. CAIRO, A. The Functional Art: An Introduction to Information Graphics and Visualization. Berkeley: New Riders, 2012. COLEMAN, J. S. Social Capital and the Creation of Human Capital. American Journal of Sociology, n. 94, p. S95-S120, 1988. CUTLER, F. Jeremy Bentham and the Public Opinion Tribunal. The Public Opinion Quarterly, v. 63, n. 3, p. 321175
346, 1999. Disponível em: . DEGENNE, A.; FORSE M., Introducing Social Networks. 1. ed. London: SAGE Publications Ltd., 1999. EASLEY, D.; KLEINBERG, J. Networks, Crowds, and Markets: Reasoning About a Highly Connected World. Cambridge University Press, 2010. Disponível em: . ELLISON, N. B.; BOYD, D. Sociality through Social Netowrk Sites. In: DUTTON, W. H. (Org.). The Oxford Handbook of Internet Studies. Oxford: Oxford University Press, 2013, p. 151–172. ELLISON, N.; C. STEINFELD; LAMPE, C. The Benefits of Facebook “Friends:” Social Capital and College Stu- dents’ Use of Online Social Network Sites. Journal of Computer Mediated Communication, 12(4):1143–1168, 2007. EVERETT, M.G.; BORGATTI, S.P. Networks Containing Negative Ties. Social Networks, v. 38, p. 111–120, 2014. FOUCAULT, M. A Ordem do Discurso. Aula Inaugural no Collège de France. 02 de dezembro de 1970. São Paulo: Ediçoes Loyola, 5a edição, 1999. FOUCAULT, M. A Arqueologia do Saber. Rio de Janeiro: Forense Universitária, 2009. FRAGOSO, S., RECUERO, R. & AMARAL, A. Métodos de Pesquisa para Internet. Porto Alegre: Sulina, 2011. FREEMAN, L. The development of social network analysis. Vancouver: Empirical Press, 2004. FRUCHTERMAN, T.; REINGOLD, E. Graph Drawing by Force-directed Placement. Software – Practice and Experience, v. 21, n. 11, p. 1.129-1.164, 1991. GRANOVETTER, M. S. The Strength of Weak Ties. American Journal of Sociology, v. 78, n. 6, p. 1.360-1.380, 1973. GRANOVETTER, M. S. Getting a job: a study of contacts and careers. Cambridge, Massachusetts: Harvard University Press, 1974. 176
GUILLORY, J. Genesis of the Media Concept. Critical Inquiry, v. 36, n. 2, p. 321-362, 2010. Disponível em: . HAGEN, W. Metaxy: Eine historiosemantische Fußnote zum Medienbegriff. In: MÜNKER, S. e ROESLER, A. (Orgs.). Was ist ein Medium? Frankfurt am Main: Suhrkamp, 2008. HABERMAS, J. Strukturwandel der Öffentlichkeit: Untersuchungen zu einer Kategorie der bürgerlichen Gesellschaft. Frankfurt am Main: Suhrkamp, 1991. HALL, S. Foucault: Power, Knowledge and Discourse. In: WETHERELL, M.; TAYLOR, S.; YATES, S. (Orgs.). Discourse Theory and Practice: A Reader. Londres: Sage, 2001. (p. 324-344) HAMPTON, K.; WELLMAN, B. Neighboring in Ne- tville: How the Internet supports community and social capital in a wired suburb. City & Community, 2(4):277-311, 2003. HANSEN, D.L.; SCHNEIDERMAN, B., Ben; SMITH, M. Analyzing social media networks with NodeXL: Insights from a Connected World, Morgan Kaufmann. New York: Elsevier, 2011. HEGEL, G. W. F.; MOLDENHAUER, E. Phänomenologie des Geistes. 4. Aufl.. Frankfurt am Main: Suhrkamp, 1993. 598 S. HERRING, S.C. Discourse in Web 2.0: Familiar, reconfigured, and emergent. In: TANNEN, D.; TESTER, A.M. (Orgs.) Georgetown University Round Table on Languages and Linguistics 2011: Discourse 2.0: Language and new media, p.1-25, Washington, DC: Georgetown University Press, 2013. HERRING, S.C. Computer-mediated discourse analysis: An approach to researching online behavior. In: BARAB, S.A.; KLING, R.; GRAY, J.H. (Orgs.). Designing for Virtual Communities in the Service of Learning, p.338-376. New York: Cambridge University Press, 2004. 177
HERRING, S.C. Computer-mediated discourse. In: SCHIFFRIN, D.; TANNEN, D.; HAMILTON, H. (Orgs.). The Handbook of Discourse Analysis, p. 612-634. Oxford: Blackwell Publishers, 2001. HUBERMAN, B.; ROMERO, D.; WU, F. Social Net- works that Matter: Twitter under the Microscope. First Monday, 14(1), 2009. Disponível em: http://firstmonday.org/ ojs/index.php/fm/article/view/2317/2063. Acesso em: 20/08/2013. JACOMY, M.; VENTURINI, T.; HEYMANN, S.; BASTIAN, M. ForceAtlas2, a continuous graph layout algorithm for handy network visualization designed for the Gephi software. PLOS One, v. 9, n. 6, 2014. Disponível em: . Acesso em: 8 jan. 2015. KADUSHIN, C. Who benefits from network analysis: ethics of social network research. Social Networks, 27(2):139153, 2005. Disponível em: http://www.sciencedirect. com/science/article/pii/S037887330500016X. Acesso em: 20/08/2013. KLEINBERG, J. Challenges in mining social network data: processes, privacy, and paradoxes. Proceedings of the 13th ACM SIGKDD International Conference on Knowledge discovery and data mining, New York, 1:45, 2007. Disponível em: http://dl.acm.org/citation. cfm?id=1281195. Acesso em 16/08/2014. KOBOUROV, S. Spring Embedders and Force Directed Graph Drawing Algorithms. ARXIV.org. Cornell, 01/2012. Disponível em . KRIPPENDORF, K. Content Analysis, An Introduction to Its Methodology. 3. ed. Thousand Oaks, CA: Sage Publications, 2012. LEMERT, J. B. Does mass communication change public opinion after all? : a new approach to effects analysis. Chicago: Nelson-Hall, 1981. x, 253 p. 178
LIN, N. Social Capital. A Theory of Social Structure and Action. Cambridge: Cambridge University Press, 2001. LUCE, R. D.; PERRY, A. D. A method of matrix analysis of group structure. Psychometrika, v.14, p.95-116, 1949. MALINI, F. Cobertura colaborativa nas redes sociais: entre a emergência e a programação. Anais do 9o Encontro Nacional de Pesquisadores em Jornalismo. Anais... Rio de Janeiro: SBPJor, 2011. MALINI, F.; ANTOUN, H. A internet e a rua. Porto Alegre: Sulina, 2013. MARKHAM, A.; BUCHANAN, E. Ethical Decision-Making and Internet Research: Recommendations from the AoIR Ethics Working Committee, v. 2, AoIR, 2012. Disponível em: . Acesso em: 27 abr. 2014. MARTIN, S.; BROWN, W.M.; KLAVANS, R.; BOYACK, K. OpenOrd: An Open-Source Toolbox for Large Graph Layout, SPIE Conference on Visualization and Data Analysis (VDA), 2011. Disponível em: . Acesso em: 8 jan. 2015. MCLUHAN, M. Understanding Media: The Extensions of Man. New York: McGraw Hill, 1964. MILGRAM, S. The Small World Experiment. Psychology Today, v. 1, n. 1, maio 1967, p.61-67. Disponível em: . Acesso em: 08 jan. 2015. MÜNKER, S.; ROESLER, A. Was ist ein Medium? Orig.-Ausg., 1. Aufl.. Frankfurt am Main: Suhrkamp, 2008. 341 S. NEWMAN, J. The structure and function of complex networks. 2003. Disponível em: . Acesso em: 8 jan. 2015. NEWMAN, M.; BARABASI, A.-L.; WATTS, D. J. The structure and dynamics of networks. Princeton: Princeton University Press, 2006. 179
180
NOVALIS; TIECK, L.; SCHLEGEL, F. V. Schriften. 4. Ausg. Stuttgart: Macklot, 1826. XXVIII, 482 OSGOOD, C. The representational model and relevant research methods. In: POOL, I. de S. (Org.) Trends in Content Analysis, Urban, Univ. of Illinois Press, 1959. PEREIRA, B.C.; ARAÚJO, R.F. Revista Anagrama, 7(1):1-15, 2013. Disponível em: http://www.revistas.univerciencia. org/index.php/anagrama/article/view/8622/7918. Acesso em: 20 ago. 2013. RECUERO, R. Redes Sociais na Internet. Porto Alegre: Sulina, 2009. RECUERO, R. A Conversação em Rede. Porto Alegre: Sulina, 2012. RECUERO, R.; ZAGO, G. A Economia do Retweet: Redes, difusão de informações e capital social no Twitter. Contracampo, v. 24, n. 1, 2012. RECUERO, R.; ZAGO, G. Em busca das “redes que importam”: Redes Sociais e Capital Social no Twitter. Revista Líbero, v. 12, n. 24, p. 81-94, 2009. Disponivel em: . Acesso em: 13 out. 2014. RILKE, R. M.; ZINN, E. Sämtliche Werke. Frankfurt am Main: Insel, 1976. SALGANIK, M.; WATTS, D. Web-Based Experiments for the Study of Collective Social Dynamics in Cultural Markets. Topics in Cognitive Science, v.1, 2009, p. 439–468 SCOTT, J. Social Network Analysis: A handbook. 2.ed. New York: SAGE Publications Ltd, 2004. SCOTT, J. Social Physics and Social Networks. In: SCOTT, J. e CARRINGTON, P. J. (Orgs.). The SAGE handbook of social network analysis. London: SAGE publications, 2011. SCOTT, J. Social Network Analysis. 3.ed. Londres: Sage Publications, 2013. SCOTT, J.; CARRINGTON, P. J. (Orgs.) The SAGE handbook of social network analysis. London: SAGE publications, 2011.
STEINFELD, C.; ELLISON, N.; LAMPE, C. 2008. Social capital, self-esteem, and use of online social network sites: A longitudinal analysis. Journal of Applied Developmental Psychology, 29(6):434-445. Disponível em: https://www. msu.edu/~steinfie/ Steinfield_Ellison_Lampe(2008). pdf. Acesso em: 20/08/2013. TÖNNIES, F. Kritik der öffentlichen Meinung. Berlin: Springer, 1922. 583 TRÄSEL, M. Entrevistando planilhas: estudo das crenças e do ethos de um grupo de jornalistas guiados por dados no Brasil. Tese (Doutorado em Comunicação Social), Pontifícia Universidade Católica do Rio Grande do Sul, Porto Alegre, 2014. TRÄSEL, M. Jornalismo Guiado por Dados: relações da cultura hacker com a cultura jornalística. Anais do XXII Encontro da Compós. Anais... Salvador: Compós, 2013. VAN DIJCK, J. The Culture of Connectivity. Oxford: Oxford University Press, 2013. VIRISSIMO, V. Apuração jornalística na Internet: Definição e características. Um estudo de caso com jornalistas de radio, televisão, jornal e internet do Grupo RBS em Florianópolis. Dissertação (Mestrado em Jornalismo), Universidade Federal de Santa Catarina, Florianópolis, 2009. WASSERMAN, S.; FAUST, K. Social Network Analysis: Methods and Aplications. 1.ed. Cambridge: Cambridge University Press, 1994. WATTS, D. Small Worlds: The Dynamics of Networks between Order and Randomness. Princeton University Press, 2003. WATTS, D.; STROGATZ, S. Collective dynamics of ‘smallworld’ networks. Nature, v. 393, p. 440-442, 1998. WELLMAN, B. Computer Networks As Social Networks. Science, 293(5537):2031-2034, 2001. WELLMAN, B.; BERKOWITZ, S. Social Structures: A Network Approach. USA, Emerald Group Publishing Limited, 528 p. (Contemporary Studies in Sociology, Vol. 15), 2007.
181
WELLMAN, B.; HAASE, A.Q.; WITTE, J.; HAMPTON, K. Does the Internet increase, decrease, or supplement social capital? Social networks, participation, and community commitment. American Behavioral Scientist, 45(3):436, 2001. WEST, A.; LEWIS, J.; CURRIE, P. Students’ Facebook ‘friends’: public and private spheres. Journal of Youth Studies, 12(6), 2009. Disponível em: http://www.tandfonline. com/doi/ abs/10.1080/13676260902960752#.UiXz4mQqfpw. Acesso em: 20/08/2013. WHITE, D.; BORGATTI, S. Betweenness centrality measures for directed graphs. Social Networks, n. 16, p. 335-346, 1994. ZAGO, G.S. Circulação e Recirculação de Narrativas do Acontecimento no Jornalismo em Rede: a Copa do Mundo de 2014 no Twitter. Tese (Doutorado em Comunicação e Informação), Universidade Federal do Rio Grande do Sul, Porto Alegre, 2014. ZAGO, G. Do Boato à Notícia: Considerações sobre a Circulação de Informações entre Twitter e Mídia Online de Referência. In: A. AMARAL; M.C. AQUINO; S. MONTARDO, INTERCOM SUL 2010: Perspectivas da Pesquisa em Comunicação Digital. São Paulo, Intercom, p. 174-206, 2010. Disponível em: http://galaxy.intercom.org.br/ebooks/ arquivos/ad5879b9c4f8d22f17340e630f1bed60.pdf#page=174. Acesso em: 20/08/2013. ZAGO, G.; REBS, R. Usos e Apropriações do Foursquare no Brasil: Apontamentos para Discussão. Revista Nexi, 1:115, 2011. Disponível em: http://revistas.pucsp.br/index. php/nexi/article/ view/3312. Acesso em: 20 ago. 2013.
182
Composto especialmente para a Editora Meridional em Cambria, corpo 11,5/15,3 e impresso na Gráfica Xxxxxxxxx.