Tutkijat käyttävät AI: tä Vatikaanin salaisten arkistojen digitointiin

Vatikaanin salaisessa arkistossa on noin 35 000 tilavuutta ja yli 80 km kirjahyllyllä täytettyjä hyllyjä, ja se on yksi ihmiskunnan tärkeimmistä historiallisista kokoelmista. Vanhin käsikirjoitus on peräisin 8. vuosisadan lopulta. Ongelmana on, että sitä ei voida käyttää käytännössä, mutta se on vain tutkijoiden käytettävissä, jotka voivat muuttaa katolisen kirkon päämajaan.

Ryhmä tutkijoita Roma Tre -yliopistosta ja La Sapienza -yliopistosta, molemmat Italian pääkaupungissa, haluavat muuttaa sitä. He kehittävät In Codice Ratio -nimistä projektia, jonka tarkoituksena on kopioida kaikki arkistojen sisällöt, joihin yleisö voi tutustua.

Tätä varten ryhmä työskentelee yhdistelmällä keinotekoista älyä ja optista merkkitunnistusta (OCR). He käyttävät uutta tekniikkaa soveltaa nykyistä tietämystä tekstintunnistussovelluksesta käsin kirjoitettuihin teksteihin ja jakamalla sanat pieniksi paloiksi, jotka riippuvat alueen musteen määrästä. Tämän avulla voit erottaa jokaisen kirjaimen erikseen ja muuttaa paperin digitaaliseksi asiakirjaksi.

Tekstin kuvakaappaus.

Vasemmalla käsin kirjoitettu teksti; keskellä oikea sana; ja oikealla, mitä ohjelma on tunnistanut.

Italian lukion oppilaat tekivät keinotekoisen älyn koulutuksen, joka vastaa näiden tekstiosien tunnistamisesta latinalaisen aakkosen kirjaimiksi. He vastasivat useisiin kyselyihin ja havaitsivat, mitkä kuvat edustavat haluttuja kirjeitä.

Kaiken tämän tulos testattiin, kun ryhmä suoritti testit käyttämällä noin 18 000 sivua kirjeitä, jotka oli tallennettu arkistoon. Tutkijoiden mukaan ohjelma pystyi tunnistamaan oikein 96% kirjaimista, ja kolmannes sanoista sisälsi ainakin yhden väärän merkin. Koska tämä tekniikka tietää aina, että sen virheet tunnistetaan, nämä luvut paranevat todennäköisesti vasta tulevissa yrityksissä.

In Codice Ray -sivustolla voit nähdä kaikki hakutulosten yhteydessä julkaistut artikkelit.

Tutkijat skannaavat AI: n avulla Vatikaanin salaiset tiedostot TecMundon kautta