El identificador de textos





por Jorge Majfud

En la academia todavía tenemos la manía de andar pensando cosas raras sin un propósito definido de antemano. Es una vieja tradición, con algunos casos célebres. Hay gente que se pasa la vida tratando de descubrir por qué las polillas se posan en un ángulo alfa en los meses de setiembre y marzo; o por qué decimos “aquí” en lugar de “acá”, and so on. Muchos fracasan, pero por cada uno que logra responder ese tipo de preguntas bizarras luego resulta que medio pueblo se salva de una catástrofe o termina masacrado por algún hombre práctico que no pierde su tiempo en descubrir “por qué” pero está seguro en “cómo” aplicarlo a la realidad. ¿Qué se imaginaba Einstein que sus especulaciones de 1905 sobre la relatividad del tiempo terminarían en la bomba atómica?

Tiempo atrás estuvimos trabajando en un interesante programa que llamamos IT (Identificador de Texto). La idea se me había ocurrido hace varios años y es muy simple: toda existencia deja trazas. En el caso de la expresión de la escritura, la historia es conocida. La caligrafía tradicional se centra principalmente en el trazo del autor. Cada persona dibuja o da un énfasis particular a cada letra, a cada palabra. De hecho cualquiera puede distinguir, más o menos, el manuscrito de un hombre del de una mujer (y sus variaciones) o el manuscrito de un tímido del de un extrovertido, con sólo echar una mirada a la caligrafía. Algo parecido ocurría también en la era de las maquinas de escribir. Cada máquina tenía un golpe de letra particular, por lo cual no resultaba difícil identificar al autor de un texto anónimo si se localizaba la maquina. Para evitar esta identificación del anónimo, se inventó luego la misiva hecha de letras y palabras recortadas de los diarios.

En el mundo electrónico el anonimato pareció triunfar finalmente. Muchos lectores de diarios aprovechan esta creencia del anonimato inventándose seudónimos y descargando sus frustraciones ocultas en el travestismo de su identidad propia. Obviamente que cada vez que alguien pone un comentario anónimo en cualquier sitio graba su IP, el cual es expuesto al administrador de dicha página digital. Ni que hablar de un correo electrónico.

Pero aún así queda la posibilidad de que el anónimo use una computadora pública o se conecte en el wireless del parque más cercano o de la librería donde toma café. En países como Estados Unidos, resulta bastante difícil no encontrar un servicio gratuito de Internet o una computadora libre en algún restaurante o en alguna universidad. En Asia, África y en América Latina son más comunes los cyber cafes. A los efectos es lo mismo: el receptor muchas veces puede saber de dónde procede un mensaje X o el comentario de un lector registrado o sin registrar en un diario, por ejemplo, pero muchas veces no puede detectar directamente quién es el autor.

En el mundo digital no tenemos la caligrafía del escritor ni el golpe de tecla de la máquina de escribir, pero tenemos un rastro inequívoco, si se lo analiza a gran escala: la sintaxis y la gramática que, desde un punto de vista radical, es como las huellas dactilares de cada persona.

Como el tono de voz y como cualquier expresión humana, la gramática profunda de cada
individuo es casi tan particular como su ADN. No hay en el mundo dos personas que escriban exactamente igual. Por supuesto que en el proceso de investigación y prueba, también consideramos y valoramos la autodeformación deliberada: faltas ortográficas realizadas a posteriori o intencionalmente, desplazamientos forzados de adjetivos o de sustantivos, una duplicación pronominal donde no la había, una variación en el dativo, un complemento indirecto redundante, una voz pasiva en lugar de la activa, eliminación de artículos o abuso de gerundios, de leísmos o de tiempos verbales como el pasado perfecto (más propio de España que de Chile, por ejemplo), adopción de estilos de clases sociales que le son ajenas al autor, etc.

No obstante, al igual que aquellos que escribían a mano intentaban deformar su propia letra para crear el anonimato, esta deformación es prácticamente imposible ante los ojos de un experto calígrafo. En el mundo digital no tenemos la ventaja del trazo de la mano en el papel pero, en cambio, poseemos un número de ocurrencias que multiplican varias veces las cartas a mano. Por otro lado, con el uso de una computadora especializada de poder mediano, es posible realizar millones de combinaciones sintácticas y gramaticales. Es aquí que, a partir de un determinado número de textos, la identidad se reconoce con una precisión que no deja dudas. Esta idea puede resultar extraña o compleja, pero es fácil de comprender si recurrimos a una metáfora: si una persona se saca una cantidad X de fotografías y en cada una cubre una parte diferente de su rostro haciendo irreconocible su identidad en cada una de las fotografías, evidentemente basta un numero específico de fotos “enmascaradas” para tener el retrato exacto, desenmascarado, del hombre de las múltiples caras. Un experimento semejante se podría hacer con los diferentes personajes representados por un mismo actor. La combinación no arrojaría ninguno de sus personajes particulares sino el retrato del actor.

Este proyecto lingüístico tenía virtudes y defectos. La contra era que en cierta medida hubiese podido incrementar una práctica de “gran hermano”, de la cual somos todos victimas hasta cierto punto. La ventaja era que ayudaba a desenmascarar desde criminales hasta pequeños insultantes. Hubo un caso, por ejemplo, el de un texto firmado por un seudónimo que luego de testeado arrojó la identidad de un político algo conocido, sin mucha trascendencia.

Finalmente abandonamos el proyecto. Había más dudas que certezas sobre sus posibles aplicaciones. No obstante sabemos que no pasará mucho tiempo antes que alguien más se le ocurra la misma idea y, por supuesto, haga mucho dinero en el proceso. Porque uno de los fenómenos más interesantes de nuestro tiempo es ver cómo alguien o un pequeño grupo, en uso y abuso de su propio ingenio, logra que millones de personas trabajen gratuitamente para ellos. En casos, además, quienes trabajan gratuitamente lo hacen con pasión y alegría, ya que se sienten protagonistas y participes de alguna forma de poder o de liberación prefabricada.

Comentarios