SETIT 2005 3rd International Conference: Sciences of Electronic, Technologies o
SETIT 2005 3rd International Conference: Sciences of Electronic, Technologies of Information and Telecommunications March 27-31, 2005 – TUNISIA Codage source d’images de documents complexes suivant la qualité de service attendue Nadia BALI*/ **, Bénédicte ALLIER*, Christian OLIVIER** et Hubert EMPTOZ * * LIRIS FRE CNRS 2672, INSA de Lyon,** SIC FRE CNRS 2731, Université de Poitiers nadia.bali@etu.univ-poitiers ; fr ,olivier@sic.sp2mi.univ-poitiers.fr { benedicte.allier; hubert.emptoz }@liris.cnrs.fr Résumé: Dans le présent papier, nous intervenons au niveau des deux dernières étapes d'un processus de numérisation qui sont la compression et la transmission. Plus précisément, nous cherchons à compresser en fonction du document lui- même et de la qualité de service attendue à la réception. Nous avons essentiellement présenté les limites des bibliothèques numériques existantes au niveau de la compression et de l’accès à l’information. Notre étude a permis de déboucher sur une méthode de codage source qui assure plus de robustesse face aux erreurs de transmission. Cette robustesse de la méthode se situe dans la hiérarchie du document codé qui consiste à bien séparer les différentes parties du document pour mieux les protéger lors de la transmission (le nombre de formes et leurs positions initiales seront séparées des points de contour). Elle se situe aussi dans la tolérance de l’approximation du contour qui fait que même en cas de perte de points on ne perd pas la forme. Mots clés: Codage Source , codage conjoint, transmission, approximation contour 1. Introduction A l’heure actuelle, il n’existe pas d’outils réellement adaptés à une exploitation à distance des collections numérisées (cf. Figure 1). Jusqu’à maintenant, le besoin majeur était de stocker les données, surtout dans le cas d’archives ou de collections de documents, sans se soucier de la qualité de la transmission étant donné que les documents sont consultés à partir de CD en local ou sur des réseaux locaux qui n’ont pas de problèmes de pertes de paquets de données. Figure 1. Exemple de documents d’ouvrages Aujourd’hui, avec les progrès technologiques de la transmission sans fil, il est devenu possible de créer des réseaux locaux sans fil à haut débit qui permettent de relier des ordinateurs portables, des machines de bureau, des assistants personnels (PDA) ou même des périphériques à liaison haut débit (11 Mbps) sur un rayon de plusieurs dizaines de mètres. De nouveaux besoins s’imposent, les usagers des bibliothèques numériques désirent de plus en plus de fonctionnalités qui ne peuvent pas encore être offertes en temps réel. Ils cherchent d’abord une plus grande accessibilité aux ouvrages, aux images et à leurs contenus. L’accessibilité traduit une possibilité de consultation en-ligne facile et rapide, ainsi qu’une possibilité d’interrogation avancée des contenus pour trouver l’information désirée. Ce besoin nécessite une compression plus efficace des images ainsi que la définition d’un format de données qui permettent une interrogation de leurs contenus. Le format doit aussi permettre de gérer tous les contenus d’une bibliothèque numérique qui sont, par définition, des données hétérogènes (textes, images, structures, annotations par des objets multimédia, hyperliens…) . Nous nous plaçons devant un système de numérisation de documents anciens à mettre à disposition d’un large panel d’utilisateurs, depuis le chercheur éclairé jusqu’au néophyte. Le processus de numérisation se présente comme une suite complexe d’opérations (cf. Figure 2) : • Sélection des ouvrages, • Numérisation proprement dite, c’est-à- dire obtention d’une série de fichiers qui sont des topographies numériques des pages des livres, • Traitements des images (nettoyage, corrections des défauts, binarisation,…) • Indexation par reconnaissance des zones textuelles et des zones graphiques, • Intégration dans la base de données, • Compression, SETIT2005 • Transmission. Figure 2. Processus générique de numérisation des collections Notre mission se situe dans les deux dernières étapes de ce processus qui sont la compression et la transmission. Plus précisément, nous cherchons à compresser en fonction du document lui-même et de la qualité de service attendue à la réception. 2. Méthodes de compression existantes D’un point de vue compression, il existe déjà différents formats tels que JPEG [RAM00] et JPEG2000 [MUK02] qui sont très efficaces pour traiter des images photographiques (la taille de l’image de départ est divisée en moyenne par 10) mais qui se révèlent inopérants sur des images issues de documents anciens (livres, plans, cartes, lettres manuscrites, …). En effet, JPEG est une méthode de compression psycho-visuelle qui retire l’information non perçue par l’œil humain mais affecte l’analyse automatique des images ; les déformations visuelles trop importantes affectent même la lisibilité du texte qui contient de nombreux détails (cf. Figure 3). Figure 3. Extraits de texte au format BMP (à gauche) :16,2ko et au format JPEG (à droite) : 1,09ko La compression JPEG2000 offre un meilleur rendu visuel pour un taux de compression similaire à celui de JPEG. Néanmoins les images compressées grâce à JPEG2000 souffrent d’un effet de flou particulièrement accentué si le taux de compression est élevé. Ce phénomène peut rendre alors plus difficile l’utilisation de certains traitements tels que la binarisation ou la localisation précise des contours des caractères. De nouveaux formats de compression d’image ont donc été développés comme TIFF ou JBIG2 [HOW97]. JBIG2 utilise pour la première fois une connaissance a priori (on parle de « model-based coding ») du contenu d’un document avec la séparation texte/graphique et la redondance des formes des éléments de la partie textuelle. Cette approche constitue une très bonne alternative puisqu’elle est adaptée à la répétition des formes de caractères ou de symboles qui apparaissent fréquemment dans les images de texte. La compression par redondance des formes génère une image artificielle où toutes les formes redondantes sont substituées par une forme générique unique. Bien que restant lisible, l’image décompressée laisse apparaître des erreurs de substitution entre caractères, lesquelles sont dues à la méthode d’appariement des formes. Pour retrouver une image plus proche de l’originale, il faut donc conserver la trace résiduelle des informations perdues par la substitution des formes de caractères. JBIG2 propose plusieurs stratégies pour comprimer l’information résiduelle. JBIG2 a spécifié le format et les méthodes, mais ne propose pas de mise en œuvre particulière. Des solutions intéressantes pour la compression des images couleurs de textes ont été développées comme la méthode DjVu (Bottou et al. 98) élaborée par AT&T et TIFF-FX par Xerox. Ces nouvelles approches permettent d’atteindre des taux de compression supérieurs à 1:100 en utilisant des informations sur la spécificité des images de documents. La compression des images couleur de texte est effectuée en séparant l’arrière-plan ou "fond" (texture du papier) de l’avant-plan ou "forme" (image de traits comportant les caractères, dessins, éléments graphiques…) et en appliquant sur chaque plan une compression adaptée. Une variante des dernières méthodes de compression des images de textes imprimés a été développée dans le cadre du projet DEBORA (Digitisation of Books of the RenAissance). Le projet DEBORA [LEB02] a proposé une solution pour la consultation de livres numérisés du XVIème siècle. Ce projet est le premier à se soucier vraiment des besoins de l’utilisateur : le document n’est plus figé, il peut être découpé, échangé, modifié, visualisé par parties. Ceci a été réalisé grâce à l’extraction de l’architecture du document et au stockage de toutes les couches de façon indépendante. Plus particulièrement, il propose de diviser l’image du document en 4 plans (plan textuel, plan graphique, arrière-plan et plan compensatoire) compressés chacun avec un modèle de compression adapté (cf. Figure 4). Figure 4 Différents plans de décomposition d’une image de document Cette approche se distingue des méthodes précédentes DjVu, TIFF-FX et JBIG2 sur les points suivants : SETIT2005 • L’exploitation de la redondance des formes de caractères est faite sur toutes les pages d’un même livre et non indépendamment sur chaque page. • La compression différenciée entre les objets graphiques et les caractères permet d’éviter de surcharger le compresseur avec des éléments graphiques a priori non redondants. • Cette compression est très liée aux autres traitements ; l’étude des redondances n’étant réalisée que sur des images de caractères, il devient donc possible de faire une transcription assistée par ordinateur, afin d’obtenir un texte intégral complet d’un livre en quelques heures. Cette analyse de la redondance des caractères sur l’ensemble de l’ouvrage permet aussi la recherche par mots, la création automatique de liens entre l’image du texte et sa transcription et l’analyse de la typographie d’un ouvrage. Pour une gestion complète des documents numérisés en terme d’images, de texte (transcription/annotation), et de structure (structure physique ou logique du texte, hiérarchie des annotations…), une solution a été proposée comme une synthèse des propriétés de différents formats d’image - lesquels ne permettent notamment pas de structurer de manière suffisante le document -, et de formats de données hétérogènes (tels que SGML ou XML). Contrairement à ce que propose XML, ce format nommé Ad Hoc (Auto-Documented and Hierarchically Organized Contents format) conserve la notion de fichier unique et cohérent pour tout un document, voire une collection de documents (cf. Figure 5). Figure 5. Extrait de la structuration des informations du format AdHoc 3. Difficultés Le paramètre non pris en compte par ce format est la robustesse du fichier aux erreurs de transmission, comme nous uploads/Ingenierie_Lourd/ codage-source-d-x27-images-de-documents-complexes-suivant-la-qualite-de-service-attendue.pdf
Documents similaires










-
38
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Sep 07, 2022
- Catégorie Heavy Engineering/...
- Langue French
- Taille du fichier 0.3000MB