Forskere bruger AI til at digitalisere Vatikanets hemmelige arkiv

Hjem til ca. 35.000 bind og med over 80 km fyldte hylder med boghylder er Vatikanets hemmelige arkiv hjemsted for en af ​​menneskehedens vigtigste historiske samlinger med det ældste manuskript, der stammer fra slutningen af ​​det 8. århundrede. Problemet er, at det ikke kan fås praktisk taget adgang til det, men kun er tilgængeligt for akademikere, der kan flytte til hovedkvarteret for den katolske kirke.

En gruppe forskere fra Roma Tre University og La Sapienza University, begge i Italiens hovedstad, ønsker at ændre det. De udvikler et projekt kaldet In Codice Ratio, som sigter mod automatisk at transkribere alt indhold fra arkiverne, som offentligheden kan få adgang til.

Til dette formål arbejder teamet med en kombination af kunstig intelligens og optisk karaktergenkendelse (OCR). De bruger en ny teknik for at kunne anvende nuværende OCR-viden til håndskrevne tekster ved at dele ordene i små stykker, der afhænger af mængden af ​​blæk, der bruges i regionen. Dette giver dig mulighed for at adskille hvert bogstav individuelt og omdanne papiret til et digitalt dokument.

Tekstskærmbillede.

Til venstre den håndskrevne tekst; i midten det rigtige ord; og til højre, hvad programmet har identificeret.

Den kunstige intelligensuddannelse, der var ansvarlig for at genkende disse tekststykker som bogstaver i det latinske alfabet, blev udført af italienske gymnasieelever. De besvarede flere spørgeskemaer og identificerede, hvilke billeder der repræsenterede de ønskede bogstaver.

Resultatet af alt dette blev testet, da teamet lavede testene ved hjælp af ca. 18.000 sider med breve, der var gemt i arkivet. Ifølge forskerne var programmet i stand til korrekt at identificere 96% af bogstaverne, hvor en tredjedel af ord indeholdt mindst en forkert karakter. Da denne teknologi altid lærer, at dens fejl identificeres, forbedrer disse tal kun sandsynligvis bedre i fremtidige forsøg.

På webstedet In Codice Ray kan du se alle artikler, der er offentliggjort med søgeresultaterne.

Forskere bruger AI til at scanne Vatikanets hemmelige filer via TecMundo