Un detective experto en estadística
La investigación es, o debería ser, una ciencia exacta, y se la debe tratar del mismo modo frío y sin emoción.
Holmes en El signo de los cuatro.
Como ya hemos tenido ocasión de comprobar, Holmes presta gran atención a los detalles, los signos y los datos, que resultan fundamentales en su método de investigación. Sin embargo, tampoco descuida las grandes regularidades que estudia la ciencia de la estadística, lo que se llama la ley de los grandes números:
¡Qué extraño enigma es el hombre! Mientras que tomado individualmente es un acertijo irresoluble, el conjunto de los hombres se convierte en una certidumbre matemática. No puede usted, por ejemplo, anunciar de antemano qué es lo que hará un hombre determinado, pero se puede prever con precisión lo que hará la mayoría de ellos. Eso es lo que dice la estadística.
Muchas de las deducciones de Holmes se basan en conocimientos estadísticos, en saber cómo se comporta por regla general una mujer o un hombre en esta o aquella situación: «Conozco bien esos síntomas. La oscilación en la acera significa siempre un affaire du coeur. Necesita consejo, pero no está segura de que el asunto no sea demasiado delicado como para confiárselo a otro[268]». El análisis estadístico, como es obvio, tiene un cierto margen de error, pero si se tiene suficiente información las posibilidades de acertar también son bastante elevadas: «Ha sido una cuestión de buena suerte, porque yo solo podía hablar de lo que constituía un mayor porcentaje de probabilidades. En modo alguno esperaba ser tan exacto[269]». En ciertos casos, el método estadístico de Holmes depende de sus inmensos conocimientos de todo lo que se relaciona con las personas, no solo desde el punto de vista emocional o psicológico, sino también desde el físico: «En nueve casos de diez puede deducirse la estatura de un hombre por la largura de sus pasos», o bien: «Cuando una persona escribe en una pared, instintivamente lo hace a la altura, más o menos, del nivel de sus ojos[270]». E. J. Wagner cuenta cómo el inspector Locard de la Süreté francesa consiguió localizar a los autores de unas cartas obscenas clavadas en las puertas de algunos hogares de Lyon siguiendo la observación de Holmes; además, Locard confirmó las sospechas al reconocer la máquina de escribir de los autores siguiendo también la sugerencia holmesiana de que no existen dos máquinas de escribir idénticas.
Es evidente, de todos modos, que las cualidades de Holmes como psicólogo social y estadístico aficionado no bastan para explicar sus éxitos, dado el carácter singular de los casos a los que se enfrenta, pero también es obvio que conocer la frecuencia estadística de una determinada situación o actitud puede ser una guía inestimable en el comienzo y desarrollo de una investigación, así como conocer las costumbres y hábitos de la sociedad en la que uno vive, yendo más allá de lo trivial y lo evidente. Sin embargo, también es cierto que muchas de las deducciones de Holmes eran posibles en una época y en un país tan clasista como la Inglaterra victoriana, donde cada persona ocupaba un lugar definido en la jerarquía social y, por tanto, era fácil detectar las marcas que ese lugar o posición dejaban en sus ropas, en su cuerpo o en su comportamiento.
La relajación de las costumbres y de las jerarquías sociales no impide, sin embargo, que hoy en día se puedan aplicar métodos estadísticos, en muchos casos con mayor razón gracias al mundo digital y los datos masivos, como muestran ejemplos recientes relacionados con empresas como AOL o Netflix. Las empresas del mundo digital están obligadas por la ley a proteger la intimidad al recoger datos, mediante lo que se llama anonimización, que hace que no pueda accederse a los rasgos que identifican claramente a una persona, como el nombre, su dirección, su número de tarjeta de crédito, su fecha de nacimiento y su número de la seguridad social. A pesar de ello, cuando AOL hizo públicos los datos de búsquedas en internet para que investigadores en estadística y otras materias pudieran analizarlos, aunque antes los anonimizó cuidadosamente, convirtiendo a cada usuario en un simple número, no sirvió para nada. The New York Times, examinando y cruzando búsquedas como «solteros 60», «té saludable» y «paisajistas en Liliburn (Georgia)», logró localizar sin mucha dificultad al usuario 4417749, que resultó ser una mujer llamada Thelma Arnold, a la que un periodista del Times fue a entrevistar a su propia casa. También se demostró lo fácil que es identificar a un usuario cualquiera en el servicio de alquiler online de películas Netflix examinando y cruzando los datos de seis películas que hubiera calificado. Hoy en día, Sherlock Holmes debería tener un buen conocimiento de la minería de datos (data mining) para extraer información al instante acerca de clientes y sospechosos y descubrir conexiones inesperadas[271]. No solo eso, sin duda se sentiría muy satisfecho al descubrir que en algunas situaciones la estadística ha sido sustituida por un conocimiento preciso, al contar con muchísimos datos, a veces incluso con todos los datos.