00:00/00:00 </>
​7022.mp4
​7022.mp3

Reptes i oportunitats en la transcripció automàtica de textos manuscrits: l'explotació dels llibres de l'Ofici d'Hipoteques

Text Complet
Compartir
Enric Saguer esmenta que un dels reptes dels historiadors és afrontar el caràcter massiu de la documentació i el tractament de les sèries documentals. Amb la tecnologia de transcripció automàtica de textos manuscrits, que ara està en procés de desenvolupament, es dona resposta a aquesta gestió massiva de documentació i esdevé un pas qualitatiu alhora que canvia la manera de treballar amb la documentació d'arxiu, un canvi que exigeix noves competències per part dels historiadors. Continua distingint entre la transcripció automàtica de textos impresos i la de textos manuscrits, essent aquesta última més complicada. Anomena dues maneres de transcripció automàtica de textos: la de word spotting, la detecció probabilística de paraules clau a partir d'imatges, i la transcripció completa o diplomàtica, que seria la transcripció del text original. Aquesta última és la que ens mostra i ens explica a través del projecte de recerca cooperatiu que participa. Aquest té el focus en la transcripció automàtica de textos manuscrits per estudiar el canvi social durant la segona meitat del segle XVII a través de l'Ofici d'Hipoteques de Girona d'uns 135.000 documents. 95.900 dels quals ja estan buidats i els resultats estan en la base de dades que s'ha creat, producte d'aquesta transcripció automàtica, i que és consultable en suport web en fase de proves. Continua explicant que el procés de transcripció del text manuscrit passa per diferents fases: la de digitalització, la de descodificació i reestructuració i la de transcripció. Fa esment en les dificultats actuals d'aquesta eina pels seus costos, la taxa alta d'errors i l'exigència elevada d'un treball de correcció i normalització, malgrat que es mostra esperançat que aquestes dificultats seran superades en poc temps i esdevindrà una eina a l'abast de moltes persones. ​
Aquest document està subjecte a una llicència Creative Commons:Reconeixement – No comercial – Compartir igual (by-nc-sa) Creative Commons by-nc-sa4.0