Algoritmo reescribe la historia

El proyecto Carabela sacó a la luz otras misivas de marinos, también enviadas a la corona española y que sugieren la existencia del continente austral incluso 100 años antes.

La “Tierra austral incógnita”, lo que hoy conocemos como Australia, fue descrita por un jesuita español casi cien años antes de que el marino británico James Cook la descubriese en 1770, tal y como demuestra un manuscrito que la inteligencia artificial acaba de sacar a la luz.

La carta, dirigida al rey Felipe V de España, es una de las muchas sorpresas que salieron a la luz gracias a Carabela, un proyecto de inteligencia artificial y aprendizaje automático (machine learning) desarrollado por científicos de la Universitat Politècnica de Valencia (UPV) y del Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico.

El proyecto se probó con 125.000 documentos de tres archivos oficiales españoles que custodian cientos de millones de legajos, cartas y manuscritos relacionados con el comercio naval y la exploración española entre los siglos XVI y XIX.

Aunque actualmente todos ellos están en proceso de digitalización, dar con la información deseada a menudo supone años de trabajo para los arqueólogos e historiadores que, primero, deben saber dónde y qué buscar y, después, descifrar los enrevesados estilos de escritura de cada época.

“Hay que ser muy experto para saber lo que pone en esos documentos y, además, muchas veces la calidad de la imagen es tan baja que ni un experto es capaz de saber qué pone”, explica el físico y catedrático en informática Enrique Vidal, investigador del Centro Pattern Recognition and Human Language Technologies (PHRLT) de la Politécnica de la UPV y coordinador del proyecto.

Pero una cosa es transcribir y otra buscar. Los investigadores del proyecto Carabela consiguieron que la inteligencia artificial encuentre en pocos minutos los datos que un historiador tarda años en localizar en la maraña informativa de un archivo, de manera similar a la búsqueda que haría en Google.

La precisión o margen de error de la búsqueda depende del grado de confianza que se exija al sistema: “normalmente está al 50% pero se puede subir al 100%, es decir, el algoritmo te dará el máximo número de aciertos pero se perderá mucha información en la búsqueda; o se puede bajar al 0%, opción que dará muchos falsos positivos pero también encontrará la mayor parte de la información buscada. (I)

Algoritmo reescribe la historia

El proyecto Carabela sacó a la luz otras misivas de marinos, también enviadas a la corona española y que sugieren la existencia del continente austral incluso 100 años antes.

La “Tierra austral incógnita”, lo que hoy conocemos como Australia, fue descrita por un jesuita español casi cien años antes de que el marino británico James Cook la descubriese en 1770, tal y como demuestra un manuscrito que la inteligencia artificial acaba de sacar a la luz.

La carta, dirigida al rey Felipe V de España, es una de las muchas sorpresas que salieron a la luz gracias a Carabela, un proyecto de inteligencia artificial y aprendizaje automático (machine learning) desarrollado por científicos de la Universitat Politècnica de Valencia (UPV) y del Centro de Arqueología Subacuática del Instituto Andaluz del Patrimonio Histórico.

El proyecto se probó con 125.000 documentos de tres archivos oficiales españoles que custodian cientos de millones de legajos, cartas y manuscritos relacionados con el comercio naval y la exploración española entre los siglos XVI y XIX.

Aunque actualmente todos ellos están en proceso de digitalización, dar con la información deseada a menudo supone años de trabajo para los arqueólogos e historiadores que, primero, deben saber dónde y qué buscar y, después, descifrar los enrevesados estilos de escritura de cada época.

“Hay que ser muy experto para saber lo que pone en esos documentos y, además, muchas veces la calidad de la imagen es tan baja que ni un experto es capaz de saber qué pone”, explica el físico y catedrático en informática Enrique Vidal, investigador del Centro Pattern Recognition and Human Language Technologies (PHRLT) de la Politécnica de la UPV y coordinador del proyecto.

Pero una cosa es transcribir y otra buscar. Los investigadores del proyecto Carabela consiguieron que la inteligencia artificial encuentre en pocos minutos los datos que un historiador tarda años en localizar en la maraña informativa de un archivo, de manera similar a la búsqueda que haría en Google.

La precisión o margen de error de la búsqueda depende del grado de confianza que se exija al sistema: “normalmente está al 50% pero se puede subir al 100%, es decir, el algoritmo te dará el máximo número de aciertos pero se perderá mucha información en la búsqueda; o se puede bajar al 0%, opción que dará muchos falsos positivos pero también encontrará la mayor parte de la información buscada. (I)