Remerciez-le!

Remerciez @Admin pour avoir partagé cet document gratuitement, de la manière la plus simple, en partageant sur les réseaux sociaux.

Mastère professionnel : Bio Médical Cours : Codage et compression de l’informat

Mastère professionnel : Bio Médical Cours : Codage et compression de l’information médicale normes et recommandations quantification scalaire et vectorielle les codeurs méthodes de compression cas des signaux biomédicaux 1. les notions de base sur la compression 2. la norme DICOM 3. la quantification - scalaire, calcul d'erreur, cas des signaux biomedicaux - vectorielle 4. les techniques de compression - RLE, HUFMANN, LZW, JPEG, fractales 5. la compression video - la norme H264 1 INTRODUCTION A LA COMPRESSION Des données et des images I. Définition La compression consiste à réduire la taille physique de blocs d'informations. Un compresseur utilise un algorithme qui sert à optimiser les données en utilisant des considérations propres au type de données à compresser; un décompresseur est donc nécessaire pour reconstruire les données d’origines grâce à l'algorithme inverse de celui utilisé pour la compression. La méthode de compression dépend intrinsèquement du type de données à compresser : on ne compressera pas de la même façon une image qu'un fichier audio... La compression peut se définir par le quotient de compression, c'est-à-dire le quotient du nombre de bits dans l'image compressée par le nombre de bits dans l'image d’origine. Le taux de compression, souvent utilisé, est l'inverse du quotient de compression. Enfin le gain de compression, généralement exprimé en pourcentage, est le complément à 1 du quotient de compression : quotient de compression=nombre debitsdansl ' imagecompressée nombredebits dansl 'imaged' origine taux decompression= 1 quotient de compression nombre debitsdansl ' imaged' origine nombredebits dansl 'imagecompressée gainencompression=(1−quotient de compression)∗100 II. Types de compressions 1. Compression physique et compression logique La compression physique agit directement sur les données; il s'agit ainsi de voir les données redondantes d'un train de bits à un autre. La compression logique par contre est effectuée par un raisonnement logique en substituant une information par une autre qui lui est équivalente. 2 2. Compression symétrique et compression asymétrique Dans le cas de la compression symétrique, la même méthode est utilisée pour compresser et décompresser l'information, il faut donc la même quantité de travail pour chacune de ces opérations. C'est ce type de compression qui est généralement utilisée dans les transmissions de données. La compression asymétrique demande plus de travail pour l'une des deux opérations, on recherche souvent des algorithmes pour lesquels la compression est plus lente que la décompression. Des algorithmes plus rapides en compression qu'en décompression peuvent être nécessaires lorsque l'on archive des données auxquelles on n'accède peu souvent (pour des raisons de sécurité par exemple), car cela crée des fichiers compacts. 3. Compression avec pertes La compression avec pertes (en anglais lossy compression), par opposition à la compression sans pertes (lossless compression), se permet d'éliminer quelques informations afin d’avoir le meilleur taux de compression possible, tout en gardant un résultat qui soit le plus proche possible des données origines (c'est le cas par exemple de certaines compressions d'images ou de sons). Etant donné que ce type de compression supprime des informations contenues dans les données à compresser, on parle généralement de méthodes de compression irréversibles. Les fichiers exécutables par exemple ont notamment besoin de conserver leur intégrité pour fonctionner, en effet il n'est pas concevable de reconstruire à l'à-peu-près un programme en omettant parfois des bits et en en ajoutant là oû il n'en faut pas. 4. Encodage adaptatif, semi adaptatif et non adaptatif Certains algorithmes de compression sont basés sur des dictionnaires spécifiques à un type de données : ce sont des encodeurs non adaptatifs. Les occurrences de lettres dans un fichier texte par exemple dépendent de la langue dans laquelle celui-ci est écrit. Un encodeur adaptatif s'adapte aux données qu'il va devoir compresser, il n’utilise pas un dictionnaire déjà préparé pour un type de données. Enfin un encodeur semi-adaptatif construit le dictionnaire en parcourant le fichier, puis compresse ce dernier. 3 4 NORME DICOM I. Définition La norme DICOM Digital Imaging and Communication in Medecine est un document qui définit une méthode de communication pour les différents équipements d'imagerie médicale numérique. L’objectif est d'obtenir les images du patient englobant toutes les informations associées dans un format identique. Cette norme est maintenant utilisée par la plupart des fabricants de matériel d'imagerie médicale. Elle permet de prédire la possibilité de l'interconnexion des appareils à partir d'un Document de Conformité émis par chacune des machines. Ainsi la norme permet aux équipements de communiquer localement, à distance ou au travers un média en assurant la compatibilité des équipements et en éliminant les formats propriétaires. II. Format Le format n'est pas rigide, il contient des informations obligatoires et d'autres optionnelles sous la forme d'une suite de champs, les pixels n'étant qu'un champ particulier. Plusieurs numéros d'identification uniques UID ("Unique Identifier") sont générés automatiquement par les machines DICOM et obligatoirement présents dans chaque image DICOM. Il ne peut pas exister deux UID identiques pour désigner des informations différentes, ceci quelque soit la machine et sa localisation, ainsi l'UID d'une série d'images est spécifique à une date, un patient, une étude, un hôpital et une machine donnée. Cette identification est nécessaire non seulement pour des raisons médicales et médico-légales, mais aussi pour permettre aux machines la formation et la gestion de bases de données. DICOM : Digital Imaging and COmmunication in Medicine 5 Définition des champs :  pour les encodages explicites : o étiquette (tag) o représentation de valeur (VR - Value Representation) encodée par deux caractères o longueur de la valeur o valeur  pour les encodages implicites : o étiquette (tag) o longueur de la valeur o valeur Une étiquette est constituée de  numéro de groupe (group number) encodé par deux octets  numéro d'élément (element number) encodé par deux octets Elle est représentée sous la forme hexadécimale (DEAD, BEEF) où DEAD est le numéro de groupe et BEEF le numéro d'élément. Pour plus d'informations, voir la partie 5 du standard. L'organisation de l'information contenue dans les fichiers DICOM est organisée sous une forme séquentielle. Ainsi une information élémentaire est formée par 3 champs de données successifs : 1. Premier champs: 4 octets : correspondant aux balises du dictionnaire ( exemple âge du patient : 0x0010 1010 en hexadécimal ) 2. Deuxième champs : 4 octets correspondants la longueur en octet du champs suivant ( exemple âge codé sur 1 octet : 0x0000 0002 ) 3. Troisième champs de longueur variable , déterminé par le champs précédant correspondant à l'information identifiée par le premier champs. Exemple : Codage de l'identification du patient : Si on rencontre dans un flux de données DICOM les éléments suivants en hexadécimal: 00 10 00 20 00 00 00 0A 4A 6F 68 6E 5E 48 65 6E 72 79 , Ce flux se décompose ainsi : 6 4 quartets balise groupe 4 quartets balise élément 8 quartets longueur l du champs suivant Longueur variable l, information : 0010 0020 0000000A 4A 6F 68 6E 5E 48 65 6E 72 79 (ici l = 10 ) où : 0x0010 correspond dans le dictionnaire au code hexadécimal du groupe de données codant l'information du patient. 0x0010 0010, balise du dictionnaire indiquant que l'information sera le nom du patient Indique la longueur du champs suivant. (ici A en hexadécimal correspond à 10 en décimal ) ici signification = ASCII 4 A 6 F 6 8 6 E 5 E 4 8 6 5 6 E 7 2 7 9 J o h n ^ He n r y Ces informations se succèdent à la suite les unes des autres dans un ordre de balises croissant, il est ainsi possible d'ignorer certaines informations contenues dans des champs d'information et de passer à la balise suivante , ce qui permet de " sauter " une balise dont on ne connaît pas la signification. CODE ASCII : Char Code ASCII Char Code ASCII Char Code ASCII Char Code ASCII Char Code ASCII Cha r Code ASCII ! " # $ % & ' ( 20 21 22 23 24 25 26 27 28 0 1 2 3 4 5 6 7 8 30 31 32 33 34 35 36 37 38 @ A B C D E F G H 40 41 42 43 44 45 46 47 48 P Q R S T U V W X Y 50 51 52 53 54 55 56 57 58 59 ` a b c d e f g h i 60 61 62 63 64 65 66 67 68 69 p q r s t u v w x y 70 71 72 73 74 75 76 77 78 79 7 - * + , - . / 29 2A 2B 2C 2D 2E 2F 9 : ; < = > ? 39 3A 3B 3C 3D 3E 3F I J K L M N O 49 4A 4B 4C 4D 4E 4F Z [ \ ] ^ _ 5A 5B 5C 5D 5E 5F j k l m n o 6A 6B 6C 6D 6E 6F z { | } ~ 7A 7B 7C 7D 7E 8 Organisation du Flux de Données : on trouve uploads/Sante/ cours-mastere-biomed.pdf