Cómo Twitter da a los científicos una ventana hacia la felicidad y la salud humanas

Desde su lanzamiento público a 10 hace años, Twitter se ha utilizado como una plataforma de redes sociales entre amigos, un servicio de mensajería instantánea para usuarios de teléfonos inteligentes y una herramienta de promoción para corporaciones y políticos.

Pero también ha sido una fuente inestimable de datos para investigadores y científicos, como yo, que desean estudiar cómo los humanos se sienten y funcionan dentro de sistemas sociales complejos.

Al analizar los tweets, hemos podido observar y recopilar datos sobre las interacciones sociales de millones de personas "en la naturaleza", fuera de los experimentos de laboratorio controlados.

Nos ha permitido desarrollar herramientas para monitorear el emociones colectivas de grandes poblaciones, encuentra el lugares más felices en los Estados Unidos y mucho más.

Entonces, ¿cómo exactamente se convirtió Twitter en un recurso tan único para los científicos sociales computacionales? ¿Y qué nos ha permitido descubrir?


gráfico de suscripción interior


El mayor regalo de Twitter a los investigadores

En julio 15, 2006, Twittr (como se conocía entonces) en público lanzado como un "servicio móvil que ayuda a grupos de amigos a intercambiar ideas al azar con SMS". La posibilidad de enviar textos de grupos de caracteres 140 gratis motivó a muchos de los primeros usuarios (yo incluido) a usar la plataforma.

Con el tiempo, la cantidad de usuarios explosionada: de 20 millones en 2009 a 200 millones en 2012 y 310 millones en la actualidad. En lugar de comunicarse directamente con amigos, los usuarios simplemente les dirían a sus seguidores cómo se sentían, responderían a las noticias de manera positiva o negativa o harían bromas.

Para los investigadores, el mayor regalo de Twitter ha sido la provisión de grandes cantidades de datos abiertos. Twitter fue una de las primeras redes sociales importantes en proporcionar muestras de datos a través de interfaces de programación de aplicaciones (API), que permiten a los investigadores consultar en Twitter tipos específicos de tweets (p. Ej., Tweets que contienen ciertas palabras), así como información sobre usuarios .

Esto llevó a una explosión de proyectos de investigación que explotan esta información. Hoy, una búsqueda de Google Scholar para "Twitter" produce seis millones de visitas, en comparación con cinco millones para "Facebook". La diferencia es especialmente sorprendente dado que Facebook tiene aproximadamente cinco veces más usuarios que Twitter (y es dos años mayor).

La política de datos generosa de Twitter indudablemente dio lugar a una excelente publicidad gratuita para la empresa, ya que los medios de comunicación principales recogieron interesantes estudios científicos.

Estudiando felicidad y salud

Dado que los datos del censo tradicional son lentos y caros de recopilar, las fuentes de datos abiertos como Twitter tienen el potencial de proporcionar una ventana en tiempo real para ver los cambios en grandes poblaciones.

La Universidad de Vermont Computational Story Lab fue fundado en 2006 y estudia problemas en matemáticas aplicadas, sociología y física. Desde 2008, Story Lab ha recopilado miles de millones de tweets a través del feed "Gardenhose" de Twitter, una API que transmite una muestra aleatoria del porcentaje 10 de todos los tweets públicos en tiempo real.

Pasé tres años en Computational Story Lab y tuve la suerte de ser parte de muchos estudios interesantes que utilizan estos datos. Por ejemplo, desarrollamos un hedonómetro que mide la felicidad de la Twittersfera en tiempo real. Al centrarnos en tweets geolocalizados enviados desde teléfonos inteligentes, pudimos mapa los lugares más felices en los Estados Unidos. Tal vez, como era de esperar, encontramos Hawaii es el estado más feliz y la vitivinicultura Napa es la ciudad más feliz para el 2013. 

Un mapa de 13 millones de tweets de EE. UU. Geolocalizados de 2013, coloreados por la felicidad, con el rojo que indica felicidad y el azul que indica tristeza. PLOS ONE, autor proporcionadoUn mapa de 13 millones de tweets de EE. UU. Geolocalizados de 2013, coloreados por la felicidad, con el rojo que indica felicidad y el azul que indica tristeza. PLoS ONE, Autor proporcionado.Estos estudios tuvieron aplicaciones más profundas: la correlación del uso de las palabras de Twitter con los datos demográficos nos ayudó a comprender los patrones socioeconómicos subyacentes en las ciudades. Por ejemplo, podríamos vincular el uso de palabras con factores de salud como la obesidad, así que construimos un lexicocalorímetro para medir el "contenido calórico" de las publicaciones en las redes sociales. Los tweets de una región en particular que mencionaban alimentos altos en calorías aumentaron el "contenido calórico" de esa región, mientras que los tweets que mencionaban actividades de ejercicio disminuyeron nuestra métrica. Descubrimos que esta simple medida se correlaciona con otras medidas de salud y bienestar. En otras palabras, los tweets nos proporcionaron una instantánea, en un momento específico del tiempo, de la salud general de una ciudad o región.

Usando la riqueza de los datos de Twitter, también hemos podido ver los patrones de movimiento diario de las personas con un detalle sin precedentes. La comprensión de los patrones de movilidad humana, a su vez, tiene la capacidad de transformar el modelado de enfermedades, abriendo el nuevo campo de epidemiología digital.

Para otros estudios, investigamos si los viajeros expresan una mayor felicidad en Twitter que aquellos que se quedan en casa (respuesta: lo hacen) y si las personas felices tienden a permanecer juntas en una red social (otra vez, lo hacen). En efecto, la positividad parece estar cocida en el lenguaje mismo, en el sentido de que tenemos más palabras positivas que negativas. Este no fue el caso solo en Twitter, sino a través de una variedad de diferentes medios (por ejemplo, libros, películas y periódicos) e idiomas.

Estos estudios, y miles de personas como ellos de todo el mundo, solo fueron posibles gracias a Twitter.

Los próximos años 10

Entonces, ¿qué podemos esperar aprender de Twitter durante los próximos años 10?

Algunos de los trabajos más interesantes actualmente implican la conexión de datos de redes sociales con modelos matemáticos para predecir fenómenos a nivel de la población tales como brotes de enfermedades. Los investigadores ya han tenido cierto éxito en el aumento de los modelos de enfermedades con los datos de Twitter para pronosticar la influenza, especialmente el FluOutlook plataforma desarrollada por Northeastern University y el Institute for Scientific Interchange.

Aún así, quedan una serie de desafíos. Los datos de las redes sociales adolecen de una "relación señal / ruido" muy baja. En otras palabras, los tweets que son relevantes para un estudio en particular a menudo son ahogados por un "ruido" irrelevante.

Por lo tanto, debemos estar continuamente conscientes de lo que se ha denominado "gran arrogancia de datos"Al desarrollar nuevos métodos y no confiar demasiado en nuestros resultados. Conectado con esto debe estar el objetivo de producir predicciones interpretables de "caja de vidrio" a partir de estos datos (a diferencia de las predicciones de "caja negra", en las que el algoritmo está oculto o no es claro).

Los datos de las redes sociales a menudo son (bastante) criticados por ser pequeños, muestra no representativa de la población en general. Uno de los principales desafíos para los investigadores es descubrir cómo contabilizar estos datos sesgados en modelos estadísticos. Mientras cada vez más personas usan las redes sociales, debemos continuar tratando de comprender los sesgos en esta información. Por ejemplo, los datos aún tienden a sobrerrepresentar a las personas más jóvenes a expensas de las poblaciones de mayor edad.

Solo después de desarrollar mejores métodos de corrección de sesgo, los investigadores podrán hacer predicciones totalmente confiables a partir de los tweets.

Sobre el Autor

Lewis Mitchell, profesor de Matemática Aplicada, Universidad de Adelaide

Este artículo se publicó originalmente el La conversación. Leer el articulo original.

Libros relacionados

at InnerSelf Market y Amazon