Depuis quelques années, la numérisation est devenue incontournable.
Cette nouvelle technique crée un besoin croissant de systèmes informatiques pour la
gestion électronique des textes produits.
La société DIGISCRIB spécialisée dans la numérisation des livres et documents s'est investie,
à la demande de ses partenaires Centre d'Etudes Supérieures de la Renaissance (CESR) et son équipe des
Bibliothèques Virtuelles Humanistes (BVH) et Re-Transcripro, dans la recherche de solutions informatiques
pour l'encodage, l'analyse, la gestion et la manipulation des textes et des documents après leur traitement
OCR, ou après leur transcription.
Cette démarche va de pair avec la recherche accrue, par la société DIGISCRIB,
d'outils d'océrisation et de gestion d'images sous Linux, comme Tesseract et ImageMagick, par exemple.
Basée sur la méthode d'encodage XML/TEI, compte tenu des possibilités qu'elle offre, et des
réponses qu'elle apporte à une demande croissante, la société DIGISCRIB s'est engagée
dans le développement d'un progiciel(1) d'encodage de texte.
« EditTEI » est le nom de ce nouvel encodeur de texte. Il est développé en Java, ce qui le rend
compatible avec plusieurs plateformes : Linux, Windows, Mac, etc. Il est parfaitement trilingue :
français, anglais et espagnol.
Cette première version aboutie « EditTEI 1.6.6 » propose les fonctionnalités d'édition de texte :
la mise en page pour sa lecture le balisage interactif sans avoir à connaître ni à saisir les
balises XML/TEI. Cette tâche est réalisée à partir d'une entête de données(2) ou d'un fichier
XML/TEI existant(3), ou tout simplement à partir d'un fichier vierge(4).
Cet encodeur offre les outils d'édition habituellement utilisés, comme par exemple : ouvrir,
enregistrer, imprimer un fichier, copier, couper et coller du texte, insérer ou supprimer des
pages, gérer des caractères spéciaux ...
En plus des outils d'édition de base, le progiciel « EditTEI » permet l'ajout ou la suppression
de balises XML/TEI existantes, d'encodage de caractères en ASCII(5), UTF-8(6), entre autres, et peut
permettre sur agrément l'utilisation de dictionnaire de correction en ligne, la possibilité de
« détildage » des textes ou la dissimilation des abréviations sur demande.
|