Introducción

A estas alturas ya habrás oído hablar mucho sobre el fenómeno Big Data: su ingente potencial, sus funestas consecuencias y el nuevo paradigma, demoledor de paradigmas, que presagia para la humanidad y sus benditas páginas web. Te da vueltas la cabeza solo de pensarlo, como si te hubiesen atizado con un objeto contundente. Pero no vengo aquí a darle más bombo y platillo a este fenómeno de los datos. Vengo con la cosa en sí misma: los datos, despojados de todo el fenómeno. Vengo con un montón enorme de información real que se está recopilando y de la cual la suerte, el trabajo, la persuasión y algo más de suerte me han colocado en la posición privilegiada de poseedor y analista.

Fui uno de los fundadores de OkCupid, una web de contactos que, tras una trayectoria nada efervescente de diez largos años, ha llegado a ser una de las mayores del mundo. La fundamos entre cuatro amigos. Todos éramos de mentalidad muy matemática y la web triunfó en parte porque aplicamos esa mentalidad a las citas de pareja: llevamos algo de análisis y de rigor a lo que desde siempre habían sido los dominios de «expertos» en amor y embaucadores sonrientes como el doctor Phil. La manera de funcionar de la web no es que sea muy sofisticada —resulta que las únicas matemáticas que hacen falta para dar forma al proceso que facilita que dos personas queden para una cita consisten en un poco de aritmética básica— pero, por algún motivo, nuestro sistema ha triunfado y 10 millones de personas van a usar este año la web para buscar pareja.

Como sé por propia experiencia, a los fundadores de sitios web nos encanta alardear de grandes cifras, pero con toda certeza la mayoría de la gente que sabe usar la cabeza ha aprendido a ignorarlas: uno escucha hablar de millones por aquí y miles de millones por allá y sabe que básicamente se trata de un «Mira cómo molo» pero expresado con una ristra de ceros. A diferencia de Google, Facebook, Twitter y otras fuentes cuyos datos aparecen de manera habitual a lo largo de este libro, OkCupid es un nombre mucho menos familiar: si tus amigos y tú lleváis años felizmente casados, seguramente nunca habréis oído hablar de nosotros. Así que he pensado mucho acerca de cómo describir el alcance de nuestra web a alguien que nunca la ha usado y a quien, por consiguiente, poco le interesan las estadísticas de interacción de usuarios de una startup fundada por determinado individuo. He optado por hacerlo en términos personales. Esta noche, unas 30 000 parejas acudirán a su primera cita gracias a OkCupid. Aproximadamente 3000 de ellas acabarán manteniendo una relación duradera. Unas 200 acabarán casándose y muchas de estas, naturalmente, tendrán hijos. Ahora mismo, ya hay por ahí niños vivitos y coleando, humanos gruñones en miniatura que se niegan a ponerse los zapatos y que nunca habrían existido de no ser por los tejemanejes de nuestro html.

No voy a venirte con la pretenciosa idea de que hayamos perfeccionado nada, y cabe señalar aquí que aunque estoy orgulloso de la web que fundamos mis amigos y yo, la verdad es que no me importa en absoluto que ya seas miembro o que te vayas a crear una cuenta en ella ni nada de eso. Nunca en toda mi vida he ido a una cita online ni tampoco lo han hecho los otros dos fundadores, así que si eso tampoco va contigo, créeme, lo entiendo. El evangelismo tecnológico es una de mis cosas menos favoritas y no estoy aquí para intercambiar mis relucientes abalorios digitales por la preciosa isla de nadie. Sigo estando suscrito a revistas en papel. Todos los fines de semana me llega el Times. Me da vergüenza publicar en Twitter. No pretendo convencerte de que uses, respetes o «creas en» Internet o las redes sociales más de lo que ya lo haces, si es que lo haces. Te ruego que sigas pensando lo que has pensado siempre sobre el universo online. Pero si hay una cosa que con toda sinceridad espero que este libro te haga replantearte es lo que piensas acerca de ti mismo. Porque de eso va precisamente este libro. OkCupid no es más que el medio a través del cual yo he llegado a esta historia.

He dirigido el equipo de análisis de OkCupid desde 2009, y mi tarea consiste en dar sentido a los datos que crean nuestros usuarios. Mientras que mis tres socios cofundadores han hecho casi todo el trabajo pesado de crear el sitio web, yo me he pasado años jugando con los números. Parte de mi trabajo nos ayuda a dirigir la empresa: por ejemplo, comprender por qué y cómo hombres y mujeres ven de manera distinta el sexo y la belleza es algo que resulta esencial en una web de contactos. Pero muchos de mis hallazgos no son útiles de una manera directa, solo interesantes. No es que pueda hacerse gran cosa con el hecho de que, estadísticamente, el grupo de música menos negro del mundo sea Belle & Sebastian, o que usar el flash en una foto haga que el modelo parezca siete años más viejo, excepto para decir «¡Qué cosas!» y, como mucho, contarlo en una cena con amigos. Eso es prácticamente lo único que hemos hecho con todos esos datos durante un tiempo; la información que hemos cosechado no ha ido más allá de alguna que otra miserable nota de prensa. Pero con el tiempo llegamos a analizar tal cantidad de información que empezaron a hacerse visibles grandes tendencias, patrones de mayor alcance dentro de los más pequeños y, lo que es aún mejor, me di cuenta de que podía emplear esos datos para examinar de manera directa temas tabú como la raza. Es decir, que en lugar de preguntar cosas a la gente por medio de encuestas o llevar a cabo experimentos a pequeña escala, que es como habitualmente se ponía en práctica la sociología en el pasado, ahora puedo ir a ver directamente lo que ocurre cuando, pongamos por caso, 100 000 hombres blancos y 100 000 mujeres negras interactúan en privado. Los datos estaban ahí, esperando en nuestros servidores. Se trataba de una oportunidad sociológica irresistible.

Seguí ahondando y al ir incrementándose los descubrimientos, como hace todo aquel que tiene más ideas que público, creé un blog para írselos contando al mundo. Tras una mejora considerable, aquel blog se acabó convirtiendo en este libro. Para hacer Dataclismo he ido mucho más allá de OkCupid. De hecho, probablemente he reunido el conjunto de datos de interacción persona a persona más denso y variado que el que haya podido recopilar ningún otro individuo por su cuenta, que abarca la mayoría de las principales fuentes de información online de nuestro tiempo, si no todas. En estas páginas me serviré de esos datos no solo para hablar de los hábitos de los usuarios de una web, sino también de una serie de patrones universales.

El debate público sobre el tema de los datos se ha centrado principalmente en dos aspectos: por un lado, el espionaje gubernamental y, por otro, las posibilidades comerciales. Respecto al primero, no creo que sepa más de lo que sabéis vosotros, solo lo que he leído. Por lo que sé, el aparato de seguridad nacional nunca se ha dirigido a ninguna web de contactos para pedir acceso y, a menos que tengan pensado criminalizar la exhibición de abdominales marcadísimos sin rostro o las incesantes declaraciones de mujeres de Brooklyn sobre cuánto les gusta el whisky, cuando todo el mundo sabe que no les gusta, no se me ocurre qué interés podrían tener en ellas. Sobre el segundo aspecto, los datos como ingresos económicos, tengo algo más de conocimiento. Cuando empezaba a escribir este libro, a la prensa especializada en tecnología se le caía la baba con la OPV de Facebook: habían recopilado los datos personales de todo el mundo y estaban empezando a convertir esos datos en un montón de dinero, y estaban a punto de convertir todo aquel dinero en más dinero todavía en el mercado de valores. Un titular del Times, tres días antes de la oferta de acciones, lo dice todo: «Facebook debe convertir los datos en oro». Casi podía esperarse que apareciera Rumpelstiltskin en la página de opinión para decir: «Sí, América, esta es una compra segura».

Como fundador de una web financiada con publicidad, puedo confirmar que los datos son útiles para vender. Cada una de las páginas de un sitio web es capaz de registrar la interacción íntegra de determinado usuario —todo aquello donde hace clic, cualquier texto que teclea e incluso el tiempo que permanece en la página— y a partir de eso no cuesta nada formarse una imagen clara de cuáles son sus gustos y de cómo ponérselos en bandeja. Pero por muy increíble que pueda ser esa capacidad, no es mi intención en absoluto centrarme en cosas como que la misión oculta de nuestro país es vender loción corporal a las personas que comparten con sus amigos publicaciones sobre loción corporal. Merced a mi acceso a esos mismos datos, me propongo darle un uso distinto a esas experiencias de los usuarios —los clics de ratón, las teclas que han pulsado y los milisegundos de permanencia—. Si las dos historias recurrentes sobre el Big Data han sido la vigilancia y el dinero, yo me he pasado los últimos tres años trabajando en una tercera: la historia humana.

Puede que Facebook sepa que eres uno de los muchos fans de los chocolates M&M y, por lo tanto, te muestre ofertas relacionadas con ese producto. También sabe cuándo has roto con tu novio, te has mudado a Texas o has empezado a aparecer en multitud de fotos con tu exnovio y, por tanto, que vuelves a salir con él. Google sabe que estás buscando un coche nuevo y puede mostrarte la marca y el modelo preseleccionados para ti basándose solo en tus características psicodemográficas. ¿Eres un individuo del tipo B, amante de las emociones fuertes y socialmente consciente, mujer y de 25 a 34 años? Aquí tienes tu coche Subaru. Al mismo tiempo, Google también sabe si eres gay, si estás indignado, si eres racista o si te preocupa el cáncer que sufre tu madre. Twitter, Reddit, Tumblr, Instagram: todas estas empresas son en primer lugar un negocio, pero en un ajustado segundo lugar son también muestras demográficas de un alcance, una profundidad y una relevancia sin precedentes. Los datos digitales, de un modo casi accidental, tienen ahora la facultad de mostrarnos cómo luchamos, cómo amamos, cómo envejecemos y cómo cambiamos. No tenemos más que mirarlos: con solo alejarnos un poco, los datos nos descubren cómo se comporta la gente cuando cree que nadie la está mirando. En estas páginas os enseñaré lo que he visto. Y, por cierto, a la mierda la loción corporal.


Si lees mucha literatura de divulgación, encontrarás en Dataclismo un par de cosas poco habituales. La primera es el color gris. La segunda es que en el libro aparecen totales y grandes cifras y eso genera una curiosa ausencia en una historia que supuestamente versa sobre la gente: aquí hacen acto de presencia muy pocas personas concretas. Abundan los gráficos, las tablas y los diagramas, pero casi ningún nombre. Ha empezado a ser todo un cliché que en la divulgación científica se parta de algo pequeño y peculiar para explicar grandes acontecimientos: contar la historia del mundo partiendo de un nabo, rastrear el devenir de una guerra hasta llegar a un pez o iluminar un prisma con una linterna de bolsillo y proyectar todo un precioso arcoíris en la pared del dormitorio. Yo voy a ir en dirección contraria. Voy a partir de algo grande —un ingente paquete de terabytes de datos sobre lo que la gente hace, piensa y dice—, y pretendo filtrar a partir de eso muchas cosas pequeñas: lo que tu red de amistades opina sobre la estabilidad de tu matrimonio, por qué los asiáticos (y también los blancos, negros y latinos) son más reacios a describirse a sí mismos, dónde y por qué permanecen sin salir del armario los gais, cómo ha cambiado la manera de escribir en los últimos diez años y cómo no ha cambiado la indignación. La idea es apartar de toda narrativa la comprensión que tenemos de nosotros mismos y dirigirla hacia los números o, mejor dicho, pensar de tal modo que esos propios números sean la narrativa.

Esta manera de enfocarlo ha ido evolucionando después de mucho hurgar en las cloacas de la estadística. Dataclismo es una extensión de lo que mis colegas de trabajo y yo hemos estado haciendo durante años. Una web de contactos sirve para unir a personas, y para hacerlo de un modo creíble debe llegar hasta sus deseos, sus hábitos y sus aversiones. A partir de ahí, te dedicas a recopilar un montón de datos y detalles y te esfuerzas al máximo para traducirlos en forma de teorías generales de la conducta humana. Lo que acaba desarrollando cualquiera que se dedique a esto de trabajar entre tantísima información, a diferencia, digamos, de trabajar para la sección de enlaces matrimoniales del periódico dominical, es una afinidad especial con el confuso conjunto de la humanidad en lugar de con una pareja de individuos concretos. Acabas por comprender a la gente de forma parecida a como lo haría un químico con las partículas que se arremolinan en su solución, y a través de esa comprensión llegas a amarla.

Dicho esto, todas las webs y todos los científicos que trabajan con datos acaban por deshumanizarlos. Los algoritmos no funcionan bien con nada que no sean números, así que si quieres que un ordenador comprenda una idea tienes que convertir todo lo que puedas de ella en dígitos. Por lo tanto, lo difícil a la hora de enfrentarse a webs y apps es desmenuzar y embutir en pequeños paquetitos —uno, dos, tres…— una experiencia humana que está en continuo desarrollo sin que nadie se dé cuenta: dividir algún proceso enorme e indescriptible —en el caso de Facebook, la amistad; en el de Reddit, la comunidad; en las webs de contactos, el amor— en pedacitos que sea capaz de manejar un servidor informático. Al mismo tiempo, tienes que conservar ese no sé qué que tiene el asunto, de tal modo que el usuario tenga la certeza de que lo que le estás ofreciendo representa la vida real. Internet es una ilusión delicada: imagina que es una zanahoria cortada tan limpiamente en rodajas que mantiene su forma en la tabla de cortar y aparenta estar intacta. Y esta misma tensión —entre la condición humana en eterno progreso y la fragmentación de la base de datos— que puede hacer que sea complicado mantener un sitio web es también lo que hace que funcione la historia que pretendo contar. Las aproximaciones a cosas como la lujuria y la amistad tal como las aborda la tecnología nos brindan una oportunidad verdaderamente novedosa: poner en números puros y duros unos cuantos misterios atemporales, obtener algo de comprensión sobre experiencias que hasta ahora nos habíamos contentado con calificar de «incuantificables». A medida que esas aproximaciones han ido mejorando cada vez más, y a medida que la gente ha ido dejando que penetren cada vez más en su vida, esa comprensión se ha incrementado con sorprendente rapidez. Os daré un ejemplo rápido, pero antes quiero decir que el eslogan de OkCupid debería haber sido «Hacer descriptible lo indescriptible». Lástima.

Todo en Internet está plagado de sistemas de valoración o puntuación. Ya sea mediante los votos arriba/abajo de Reddit, las reseñas de los usuarios de Amazon o incluso el botón «Me gusta» de Facebook, las webs te piden que votes porque ese voto tuyo convierte algo que es fluido e idiosincrásico —tu opinión— en algo que pueden comprender y usar. Las webs de contactos piden a sus usuarios que se valoren entre ellos porque eso les permite transformar primeras impresiones como:

Tiene ojos bonitos

Hummm, es mono, pero no me gustan los pelirrojos

Aj, qué asco

… en simples números como, digamos, 5, 3 y 1 en una escala de una a cinco estrellas. En los sitios web se han recopilado miles de millones de estos microjuicios, de estos destellos de opinión de una persona acerca de otra. Todo ese conjunto de minúsculas reflexiones compone una inmensa fuente de conocimientos acerca de cómo llega la gente a determinadas opiniones sobre los demás.

Lo más básico que uno puede hacer con estas valoraciones de persona a persona es contarlas. Contar el total de cuánta gente tiene una media de una estrella, de dos estrellas, etcétera, y después comparar los totales. Abajo he hecho exactamente eso con los promedios de votos otorgados a mujeres heterosexuales por parte de hombres heterosexuales. La curva tiene esta forma:

img01.svg

Unos 51 millones de preferencias personales quedan reducidas a esta sencilla presentación de barras verticales. Se trata, en esencia, de la opinión de los hombres sobre la belleza femenina recopilada por OkCupid. Reúne todas las pequeñas historias (lo que un hombre opina de una mujer, multiplicado por millones de veces) y todas las anécdotas (si nos extendiésemos en cualquiera de ellas, este sería otro tipo de libro) en forma de un todo inteligible. Mirar de este modo a la gente es como observar el planeta Tierra desde el espacio: te pierdes los detalles, pero logras ver de un modo completamente nuevo algo que te es familiar.

Así pues, ¿qué nos dice esta curva? Es fácil que nos parezca corriente esta forma básica —una curva normal— porque los libros de texto probablemente nos lleven a esperar un gráfico de este tipo, pero los porcentajes podrían haber sido fácilmente más acusados en uno de los extremos o en el otro. Eso es algo que suele ocurrir cuando tratamos con preferencias personales. Tomemos las valoraciones de pizzerías en Foursquare, por ejemplo, que tienden a ser muy positivas:

valoraciones de los usuarios de Foursquare sobre pizzerías de Nueva York, en una escala de 0 a 10

img02.svg

O podemos mirar los porcentajes de aprobación del Congreso que, puesto que los políticos son moralmente lo opuesto a la pizza, tienden a ir al otro extremo:

popularidad del Congreso en las principales encuestas de los medios desde noviembre de 2008

img03.svg

Además, nuestra curva de valoraciones de hombre a mujer es unimodal, lo que quiere decir que las notas asignadas a las mujeres tienden a agruparse alrededor de un solo valor. También esto puede no parecernos nada fuera de lo normal, pero muchas situaciones presentan varios modos o valores «típicos». Si separas a los jugadores de la NBA por la frecuencia con la que han jugado en el quinteto inicial en la temporada 2012-2013, verás que te aparecen un montón de atletas agrupados en cada extremo y prácticamente ninguno en el centro:

jugadores de la NBA por porcentaje de partidos jugados desde el inicio, temporada 2012-2013

img04.svg

Ahí los datos nos dicen que los entrenadores creen que determinado jugador vale o no vale para jugar de inicio, y ese hombre, por tanto, juega o no en el quinteto inicial del equipo. Ahí tenemos claramente un sistema binario. De forma parecida, en nuestros datos de valoración, los hombres en tanto que grupo podrían haber visto a las mujeres como «preciosas» o «feas» y haberlas valorado en consonancia: igual que en el ranking de jugadores de inicio de los equipos de la NBA, la belleza podría considerarse un tema que «se tiene o no se tiene». Pero la curva que hemos mostrado al principio no nos dice eso. Pretender extraer luz de los datos muchas veces es cuestión de comparar nuestros resultados con este tipo de datos contrafácticos. Algunas veces, cuando un resultado sencillo y directo se topa con un sinfín de alternativas, se hace más notable precisamente por ser sencillo y directo. De hecho, nuestro gráfico se acerca bastante a lo que se denomina «distribución beta simétrica» —una curva que suele emplearse como modelo de decisiones equilibradas básicas—, que muestro a continuación:

percepción del atractivo femenino

img05.svg

Nuestros datos del mundo real solo difieren ligeramente (un 6 por ciento) de esa formulación ideal, lo que indica que este gráfico del deseo masculino es más o menos lo que podríamos haber supuesto si careciésemos de los datos: de hecho, es uno de esos ejemplos típicos de libro de texto que he mencionado antes. Así que la curva es predecible, centrada, tal vez incluso aburrida. ¿Y qué? Bueno, este es un contexto en el que lo aburrido resulta especial: implica que los hombres que asignaron sus valoraciones son asimismo predecibles, centrados y, sobre todo, imparciales. Y si nos paramos a pensar en las supermodelos, el porno, las chicas de portada, las superheroínas del tipo de Lara Croft, los anuncios de cerveza Bud Light y, ya si nos ponemos muy retorcidos, en los retoques hechos con Photoshop que todos esos hombres ven cada día por doquier, el hecho de que la opinión masculina sobre el atractivo femenino se mantenga donde se supone que debería estar constituye para mí, a todas luces, un pequeño milagro. Es prácticamente de sentido común que los hombres deberían de tener unas expectativas poco realistas acerca de la apariencia de las mujeres, pero aquí vemos claramente que no es así. En todo caso, son incluso más generosos que las mujeres, cuyos votos responden a esta curva:

percepción del atractivo masculino y del femenino

img06.svg

El centro del gráfico gris oscuro se ubica más o menos en el primer cuarto de la escala. Solo uno de cada seis hombres está «por encima de la media» en términos absolutos. El atractivo sexual no es algo que se acostumbre a cuantificar de este modo, por lo que me voy a permitir explicarlo en un contexto más familiar: si viésemos este gráfico en términos de cociente intelectual tendríamos un mundo en el que las mujeres opinarían que el 58 por ciento de los hombres sufre algún daño cerebral.

Vamos a ver, los hombres de OkCupid no son para nada feos —lo he comprobado haciendo un experimento: comparé un grupo extraído al azar de nuestros usuarios con otro parecido extraído de una red social y obtuve las mismas valoraciones para ambos—, y resulta que se obtienen unos patrones muy parecidos a este en cualquier otra web de contactos de las que he visto: Tinder, Match.com y DateHookup, que juntas abarcan a cerca de la mitad de la población soltera de Estados Unidos. Lo que ocurre es que hombres y mujeres hacen unos cálculos diferentes respecto al sexo. En la revista Harper’s lo explicaron a la perfección: «Las mujeres son proclives a quejarse de las experiencias sexuales que han tenido y hombres, de las que no han tenido». En el gráfico puede apreciarse perfectamente cómo funciona esto. Y yo añadiría: los hombres del gráfico deben de estar cargadísimos de quejas.

En una curva beta se plasma lo que podríamos considerar el resultado de haber tirado una moneda al aire multitud de veces: representa las probabilidades superpuestas de numerosos eventos binarios. En este caso la moneda masculina está bien compensada y salen más o menos las mismas veces cara (que equipararé a positivo) que cruz. Pero en nuestros datos vemos que la moneda femenina está descompensada: solo sale cara una vez de cada cuatro. Hay muchos procesos naturales, como la predicción del tiempo, a los que se les puede aplicar el modelo de curva beta, y gracias a los registros obsesivos de unos cuantos fanáticos de la meteorología he podido comparar nuestras valoraciones de persona a persona con algunos patrones climáticos históricos. En el caso que nos ocupa, la actitud masculina recuerda bastante a la función de predicción de cielos nublados en la ciudad de Nueva York. La psique femenina, siguiendo la misma técnica de medición, se acercaría a una ubicación con los cielos más encapotados que los de Seattle.

Seguiremos tirando de este mismo hilo a lo largo de los tres primeros grandes apartados que abarca Dataclismo: los datos de las personas que contactan. El atractivo sexual —cómo cambia y qué lo causa— será nuestro punto de partida. Veremos por qué, técnicamente, una mujer está en su momento cumbre a los 21 años, así como la importancia de tener un tatuaje destacado, pero enseguida iremos más allá de los contactos puramente carnales. Veremos qué nos pueden decir los tuits sobre la comunicación moderna y lo que pueden decirnos las amistades de Facebook sobre la estabilidad de un matrimonio. Las fotos de perfil que ponemos en la red son una bendición y a la vez una cruz: convierten casi cualquier sitio (Facebook, las webs de empleo y, por descontado, las de contactos) en un concurso de belleza. Echaremos un vistazo a lo que ocurrió cuando en OkCupid las eliminamos durante un día para ver qué pasaba. El amor no es ciego, aunque hemos encontrado pruebas de que debería serlo.

La segunda parte se centra en los datos que evidencian discordia. Empezaremos por fijarnos en esa primerísima división que existe entre los humanos: la raza, un asunto que por primera vez podemos abordar al nivel de persona a persona. Nuestros datos privilegiados ponen de manifiesto actitudes que la mayoría de la gente nunca admitiría en público, y veremos que el sesgo racial no solo es fuerte y habitual, sino que se repite casi palabra por palabra (o, mejor dicho, número por número) en cualquier sitio web. El racismo puede ser también una cosa interna: un solo hombre, su teclado y sus prejuicios. Veremos qué nos tienen que decir las búsquedas de Google sobre la palabra más odiada del país, y qué nos dicen también sobre el propio país. Pasaremos luego a explorar la disensión sobre la belleza física apoyándonos en un paquete de datos miles de veces mayor que cualquier otro que se haya analizado nunca antes. La fealdad tiene un sorprendente coste social que por fin somos capaces de cuantificar. A partir de ahí, veremos lo que nos descubre Twitter sobre la indignación. Esta red social permite que la gente esté conectada minuto a minuto, pero también puede separarnos con idéntica rapidez. La indignación colectiva que posibilita aporta una nueva nota de violencia a la más antigua modalidad de reunión humana: la muchedumbre. Veremos si logra también que lleguemos a un nuevo entendimiento.

Cuando lleguemos al tercer apartado del libro ya habremos visto cómo son los datos cuando dos personas interactúan, para bien o para mal. Aquí vamos a centrarnos en el individuo en singular. Veremos cómo se expresa la identidad étnica, sexual y política centrándonos en las palabras, las imágenes y los referentes culturales que escoge la gente para expresarse. Estas son cinco de las frases más típicas de una mujer blanca:

mis ojos azules

pelirrojo y

conducir un todoterreno

chica de campo

me encanta el aire libre

¿Es un haiku de Carrie Underwood o son datos? ¡Tú eliges! Exploraremos las palabras que escribe la gente en público. También veremos cómo actúa y habla la gente en privado, con un ojo puesto en aquellos asuntos en los que las etiquetas y los actos divergen: los hombres bisexuales, por ejemplo, hacen que nos cuestionemos nuestra noción de una identidad clara. Después recurriremos a un amplio surtido de fuentes —Twitter, Facebook, Reddit e incluso Craiglist— para vernos a nosotros mismos cuando nos encontramos en casa, tanto físicamente como figuradamente. Y concluiremos con la pregunta que surge de manera natural en un libro sobre este tema: ¿cómo consigue uno preservar su intimidad en un mundo donde es posible llevar a cabo una exploración de este nivel?

A lo largo de todo el libro veremos que Internet puede ser un sitio emocionante, brutal, amoroso, indulgente, decepcionante, sensual e indignante. Y claro que lo es: lo componen seres humanos. Sin embargo, al recopilar toda esta información, me percaté de que los datos no recogen las vidas de todos. Si no tienes un ordenador o un smartphone, no sales aquí. Lo único que puedo hacer es reconocer el problema, rodearlo y esperar a que desaparezca.

Entretanto, me gustaría decir que el alcance de sitios como Twitter o Facebook, e incluso el de los datos de mi web de contactos, es sorprendentemente exhaustivo. Si no usas muchos de estos servicios online, puede ser que no lo aprecies. Cerca de un 87 por ciento de los estadounidenses están conectados a Internet, y esa cifra se mantiene prácticamente en todos los estamentos demográficos. Urbanos y rurales, ricos y pobres, negros, asiáticos, blancos y latinos, todos están conectados. El uso de Internet es menor (alrededor del 60 por ciento) entre los muy ancianos y quienes tienen menor nivel de estudios, motivo por el que he trazado en estas páginas una «línea de edad» bastante previa a la tercera edad —los 50— y por el que he optado por no abordar el tema de la educación. Más de un tercio de los estadounidenses entran en Facebook cada día. La red social tiene 1300 millones de cuentas en todo el mundo. Dado que cerca de una cuarta parte de la población mundial tiene menos de 14 años, eso significa que algo así como el 25 por ciento de los adultos del planeta tienen cuenta en Facebook. En las webs de contactos que he estudiado para Dataclismo se han registrado unos 55 millones de usuarios estadounidenses durante los últimos tres años (como he dicho antes, eso es una cuenta por cada dos personas solteras del país). Twitter es un caso de especial interés demográfico. Se trata de una brillante historia de éxito tecnológico y la empresa está consiguiendo casi por sí sola que se enriquezca una amplia franja de la población de San Francisco. Pero se trata de una red social fundamentalmente populista, tanto por la «apertura» de la plataforma como por quienes optan por utilizarla. Por ejemplo, no presenta diferencias significativas en usuarios por género; personas con estudios de bachillerato tuitean igual que usuarios universitarios; los latinos emplean la red social igual que los blancos, y los negros, el doble. Y luego, por supuesto, está Google. Si el 87 por ciento de los estadounidenses usa Internet, el 87 por ciento de ellos ha usado Google.

Estas grandes cifras no demuestran que me haya hecho una idea completa de nada, pero por lo menos sugieren que esa idea está por llegar. Y, en todo caso, lo perfecto no debería estar reñido con lo mejor que ha existido hasta ahora. Los datos con los que trabajaremos abarcan a miles de veces más personas que cualquier encuesta Gallup o Pew, eso por descontado. Lo que ya no es tan obvio es que en realidad son mucho más inclusivos que la mayoría de los estudios del comportamiento llevados a cabo en el ámbito académico.

Es un problema conocido —aunque apenas se ha debatido públicamente— que casi todas las ideas fundacionales de las actuales ciencias del comportamiento se basaron en el estudio de pequeños grupos de alumnos universitarios. Cuando estaba en la universidad, en el hospital Mass General me pagaron unos 25 dólares por inhalar durante una hora un gas ligeramente radiactivo que actuaba de marcador y después me pidieron que llevara a cabo diversas tareas mentales mientras me tomografiaban el cerebro. «No te va a causar ningún daño», me dijeron. «Será como si hubieras pasado un año en un avión», añadieron. «No es nada», continuaron. Lo que no me dijeron —y de lo que entonces tampoco me percaté— fue que mientras estaba ahí tumbado con una leve resaca en una especie de escáner o TAC, leyendo palabras y pulsando botones con el pie, lo que hacía era ejercer del típico varón humano. Un amigo mío también se presentó a aquel estudio. Era un universitario blanco, igual que yo. Me apuesto lo que sea a que la mayoría de los sujetos del estudio lo eran. Nada más lejos del típico varón humano.

Comprendo cómo funciona: en persona, conseguir una serie de datos que sean verdaderamente representativos de algo es muchas veces más difícil que llevar a cabo el propio experimento que queremos ejecutar. Si eres un profesor o un estudiante de posdoctorado que quiere progresar, te basas en lo que se llama un «muestreo por conveniencia», es decir, los alumnos de tu universidad. Pero eso supone un gran problema, sobre todo si investigas sobre creencias y comportamientos. Hasta tiene un nombre en inglés. Se llama investigación WEIRD (raro, en inglés): acrónimo de blanco (white), educado (educated), industrializado (industrialized), rico (rich) y democrático (democratic). Y la mayoría de los estudios sociales que se publican son WEIRD[1].

Varios de estos problemas proliferan también en mis datos. Todavía tiene que pasar cierto tiempo hasta que los datos digitales logren tachar definitivamente de la lista eso de «industrializado». Pero dado que la tecnología se suele ver como un «ámbito elitista» —una imagen que muchos del propio sector se empeñan en incentivar—, me veo obligado a diferenciar entre los emprendedores e inversores de capital riesgo que uno encuentra en el panorama público de la tecnología, que se dedican a gesticular mientras sueltan su cháchara por el micrófono inalámbrico y que, de hecho, suelen ser gente muy WEIRD, y los propios usuarios de esos servicios, que son mucho más normales. No pueden evitar serlo, porque el uso de esos servicios —Twitter, Facebook, Google y demás— es la norma.

En cuanto a la autenticidad de los datos, gran parte de ella viene avalada por los propios hechos, puesto que Internet ha pasado ya a formar parte de la vida cotidiana. Pensemos en los datos de OkCupid. Tú le indicas a la web cuál es tu ciudad, tu sexo, tu edad y a quién buscas y esta te ayuda a encontrar a alguien con quien quedar para tomar un café o una cerveza. Se supone que tu perfil eres tú, la versión verdadera de ti. Si subes una foto de alguien más guapo para ponerla en tu perfil, o si finges ser mucho más joven de lo que eres, seguramente conseguirás más citas. Pero piensa en cuando quedes en persona con alguien: esperará encontrar a la persona que ha visto en la web. Si tu verdadero yo no se le parece, la cita prácticamente habrá terminado en cuanto aparezcas. Este es un ejemplo de la tendencia general: conforme se mezclan los mundos online y offline, la inevitable presión social mantiene a raya muchos de los impulsos más embusteros de Internet.

La gente que usa estos servicios, tanto webs de contactos y citas como redes sociales y agregadores de noticias, anda a tientas por la vida, como se ha hecho siempre. Pero ahora lo hacen con sus móviles y sus portátiles. Casi sin darse cuenta, han generado un archivo extraordinario: ahora hay bases de datos por todo el mundo que contienen años y años de anhelos, opiniones y caos. Y como esos datos están almacenados con precisión escrupulosa, no solo pueden acabar analizándose, sino que se pueden analizar con un alcance y una flexibilidad que eran inimaginables hace solo una década.

Me he pasado varios años recopilando y descifrando estos datos. No solo los de OkCupid, sino los de casi todos los demás sitios web importantes. Y aun así nunca he podido librarme del todo de una duda inquietante y que, dadas mis simpatías por el ludismo, me irrita todavía más: me da la impresión de que escribir un libro sobre Internet es un poco como hacer un dibujo muy bonito sobre las películas de cine. ¿Para qué molestarse? Esa es la pregunta que me hago en mis horas bajas.


Hay un documental genial sobre Bob Dylan titulado Don’t Look Back que vi varias veces cuando iba a la facultad. Mi mejor amigo, Justin, estudiaba cine. En un determinado momento de la película, después de una fiesta, Bob discute con un tipo cualquiera sobre quién ha tirado o quién no ha tirado alguna cosa de vidrio en la calle. Están los dos claramente borrachos. El clímax de la discusión es este fragmento del diálogo, que no me he quitado de la cabeza durante quince años:

Dylan: Conozco a mucha gente que es como tú y habla como tú.

Tipo de la fiesta: Que te den por culo. Eres un pez gordo, ¿sabes?

Dylan: Lo sé, tío. Sé que soy un pez gordo.

Tipo de la fiesta: Sé que lo sabes.

Dylan: Soy un pez más gordo que tú, tío.

Tipo de la fiesta: Yo soy un don nadie.

Dylan: Exacto.

Y entonces aparece alguien y se ponen todos a hablar de poesía. Es una de esas noches. Pero aquí está el asunto: estrellas del rock o no, los peces gordos han sido siempre la banda sonora de la humanidad. Conquistadores, magnates, mártires, salvadores, incluso granujas (sobre todo granujas)… a través de sus vidas hemos narrado nuestra historia, hemos ido marcando nuestra progresión desde las riberas fangosas de un par de ríos a lo que sea que seamos ahora. Desde el faraón Narmer, en el año 3100 a. C., el primer ser humano cuyo nombre conocemos, hasta Steve Jobs y Nelson Mandela, la gente ha organizado el mundo basándose en un armazón de héroes. Narmer fue el primero de una antigua lista de reyes. Los escribas han cambiado, pero la lista ha seguido creciendo. Los años sesenta, con todo aquello de «la gente al poder» y tal, son un ejemplo perfecto: fue la época de Lennon y McCartney, de Dylan y Hendrix, no de un «tipo de la fiesta». Vamos, que la existencia del hombre de a pie nunca ha merecido quedar registrada, salvo cuando se cruzaba en la vida de alguien que se convirtió en una leyenda.

Pero esta asimetría está llegando a su fin: el pez chico, la masa crepitante que somos todos los demás, está logrando por fin plasmar su vida en los registros. Dado que Internet ha democratizado el periodismo, la fotografía, la pornografía, la beneficencia, la comedia y tantas otras materias de la trayectoria de las personas, acabará, espero, por democratizar nuestras historias más esenciales. Esa banda sonora no es más que incipiente todavía y está sin refinar. Pero escribo este libro para sacar a la luz aquellos tenues patrones que yo, entre otros, he detectado. Es el eco del tren que se acerca cuando apoyas la oreja en las vías. La de los datos no es una ciencia exacta: todavía tenemos que entender, reconocer y refinar cosas como los sesgos a la hora de seleccionarlos. Pero la distancia entre lo que podría ser y lo que es se reduce un poco cada día que pasa, y yo escribo para que llegue un día en el que ambas converjan.

Sé que a mucha gente se le llena la boca cuando habla de los datos, y no es mi intención aquí decir que van a cambiar el curso de la historia —ciertamente no en la manera en la que lo hicieron el motor de combustión o el acero—, pero sí que creo que cambiarán lo que es la historia. Con datos, la historia puede llegar más al fondo. Puede hacerse más grande. A diferencia de lo que ocurre con la escritura en tablillas de arcilla, en papiro y pergamino, con el papel impreso, con el celuloide o con el papel fotográfico, el espacio de disco es barato y casi inagotable. En un disco duro hay sitio para que quepan más cosas además de los héroes. Por tanto, como yo no soy ningún héroe, sino alguien a quien lo que más le gusta es pasar ratos con su familia y sus amigos y vivir la vida dignamente, eso resulta importante para mí.

Ahora bien, por mucho que me gustaría verme a mí mismo, a ti y a FulanitoDeTal81 en la misma página que al presidente en futuras obras dedicadas a la historia de esta década, imagino que la gente corriente siempre será más o menos anónima, tal como lo es incluso en estas mismas páginas. Ni los mejores datos pueden cambiar eso. Pero nos contarán a todos. Cuando en diez, veinte o cien años alguien quiera tomarle la temperatura a estos tiempos y pretenda entender los cambios producidos en esa historia —que quiera ver cómo la legalización del matrimonio homosexual reflejó y a la vez propició una mayor aceptación de la homosexualidad o cómo la población rural asiática se desarraigó y se volvió a consolidar en grandes núcleos urbanos— y llegar hasta su mismo tuétano, lo hará con los datos de Facebook, Twitter, Reddit y demás. Y si no, nuestro hipotético escritor habrá fracasado.

He tratado de abarcar todo esto en ese revoltijo que es mi título. Kataklysmos es como se llamaba en griego al diluvio del Antiguo Testamento y de ahí llegó a su actual acepción. La alusión tiene doble sentido: está, por supuesto, el hecho del aluvión de datos sin precedentes. Lo que se recopila hoy es tan profundo que roza lo insondable; es claramente un diluvio de cuarenta días y cuarenta noches en comparación con la pobre llovizna de las épocas precedentes. Pero también está la esperanza de un mundo transformado, de que el diluvio arrastre consigo tanto la raquítica comprensión que teníamos ayer como la todavía limitada visión que tenemos hoy.

Este libro lo componen una serie de viñetas, de ventanitas que se abren a nuestra vida: lo que nos une, lo que nos separa, lo que nos hace ser quienes somos. Conforme sigan llegando más y más datos, las ventanas se harán cada vez más grandes, pero hoy tenemos ya muchas cosas que ver, y el primer vistazo es siempre el más emocionante. Te animo a que te encarames al alféizar.