Истраживачи користе АИ да дигитализирају Ватиканске тајне архиве

У Ватиканском тајном архиву налази се око 35 000 свезака и са преко 80 км полица за књиге, дом једне од најважнијих историјских збирки човечанства, са најстаријим рукописом из краја 8. века. Проблем је у томе што се њему не може приступити виртуелно, а доступан је само академицима који се могу преселити у седиште Католичке цркве.

Група истраживача са Универзитета Рома Тре и Универзитета Ла Сапиенза, оба у главном граду Италије, желе то променити. Они развијају пројекат под називом Ин Цодице Ратио који има за циљ да аутоматски пребаци сав садржај из Архива којем јавност може приступити.

У том циљу, тим сарађује са комбинацијом вештачке интелигенције и оптичког препознавања карактера (ОЦР). Они користе нову технику да примењују тренутно знање о ОЦР-у на рукописне текстове, разбијајући речи у мале делове који зависе од количине мастила која се користи у региону. Ово вам омогућава да засебно одвојите свако слово и папир претворите у дигитални документ.

Снимка екрана текста.

Са леве стране рукописни текст; у средини, права реч; и са десне стране, шта је програм идентификовао.

Тренинг вештачке интелигенције одговоран за препознавање ових делова текста као слова латинице урадили су италијански средњошколци. Одговорили су на неколико упитника и утврдили које слике представљају жељена слова.

Резултат свега тога постављен је на тест када је тим направио тестове користећи око 18.000 страница писама сачуваних у Архиву. Према истраживачима, програм је могао да тачно препозна 96% слова, при чему трећина речи садржи најмање један погрешан знак. Пошто ова технологија увек учи да су утврђене њене грешке, ови бројеви ће се вероватно побољшати само у будућим покушајима.

На веб локацији Ин Цодице Раи можете видети све чланке објављене са резултатима претраге.

Истраживачи користе АИ за скенирање ватиканских тајних датотека путем ТецМундо-а