BASES DE DATOS DE MAMOGRAFÍA 

 

 DIGITAL.
 
ESTUDIO COMPARATIVO

Esther Ristori Bogajo, Francisco Sendra Portero, 

 Enrique Nava Baro, Manuel Martínez Morillo

 

                                                                 

Lawrence Livermore National Laboratories/University of California at San Francisco (LLNL/UCSF).

Esta base de datos sólo incluye casos cuyo hallazgo mamográfico sean microcalcificaciones. Presenta 198 imágenes de 50 pacientes en 12 CD-ROM, con dos proyecciones de cada mama (OML y CC), excepto en un caso de una mujer mastectomizada.

Contenido de cada caso:

· Archivo ".ics".

Las imágenes se encuentran almacenadas en formato ICS, un sistema de diseñado inicialmente para imágenes de citometría. Cada imagen posee dos archivos: uno es un archivo de cabecera en texto ascii con extensión ".ics", el cual contiene información descriptiva como el tamaño de la imagen y otra información asociada al caso. El otro, con extensión ".ids", contiene los datos de la imagen (en realidad éste último es un fichero raw, que se puede abrir con cualquier programa que lea archivos raw). Por tanto existen 197 mamografías con dos archivos cada una (el archivo de cabecera "ics" y el archivo con los datos de la imagen "ids").

Los archivos se nombran con dos letras que son el código de la paciente, seguido de "r" o "l" según se trate de la mama derecha o izquierda, seguido de dos letras más que indican la proyección ("ml" mediolateral y "cc"

· Archivos de las áreas sospechosas.

Existen 192 imágenes con áreas sospechosas identificadas. Estas áreas son determinadas por radiólogos expertos, mediante el siguiente proceso. Las mamografías se digitalizan y presentan en la pantalla del ordenador. Entonces utilizando la mamografía original y toda la información que existe disponible del caso historia clínica, diagnóstico, resultado de la biopsia..., los radiólogos marcan las calcificaciones (incluyendo las que presentan resultado benignos tras varios años de seguimiento), señalando el perímetro de la calcificación y rellenando el área de esta. Si existe una agrupación de calcificaciones, tanto si son benignas como malignas, los radiólogos señalan la extensión de la región que ocupan. Estos resultados se dibujan en el ordenador en la imagen digital archivada y se guardan en dos archivos: el primer archivo es el de las calcificaciones individuales, tanto si estas forman parte o no de una agrupación, en el otro archivo el área demarcada como región de la agrupación se almacena como área sólida, no como contorno. Las 192 imágenes están organizadas de la siguiente manera:

· 142 x 2 archivos que contienen la definición de microcalcificaciones individuales en forma binaria, con su perímetro señalado y el interior relleno. En cada agrupación de microcalcificaciones se marcan unas cuantas de ellas. También han sido marcadas algunas calcificaciones benignas que no forman parte de ningún grupo. El nombre de estos archivos lleva añadido "-mc".

· 50 x 2 archivos contienen una máscara binaria (área) que cubre la extensión la que se encuentra una agrupación de microcalcificaciones. En estas imágenes en el nombre del archivo aparecerá -cr, al final.

· Case-info: Es un archivo de extensión ascii, que contiene datos de la paciente, como tipo de mama, grado de sutileza de la lesión, los resultados de la biopsia y comentarios constatados. Este archivo se encuentra en cada CD, incluyendo la información de todos los casos que contiene.

· Manifest: Es un archivo ascii, en el que aparecen una lista de todos los casos contenidos en cada CD.

· Readme.ics: este archivo ascii contiene información sobre el formato ICS.

· ICS2ppma: se trata de un archivo con un programa para transformar imágenes en formato '.ics' a otro más usual '.ppm'.

· Readme: en este archivo, presente en cada CD, se explica con más detalle todo lo comentado anteriormente.

Características de las imágenes: Las imágenes son digitalizadas con un escáner láser, con una resolución de 35 micras y 12 bits de profundidad de niveles de gris.

Adquisición e información sobre la base de datos: La base de datos completa está constituida por doce CD-ROM. Para su adquisición contactar con:

Laura N Mascio

Biomedical Image Processing

Lawrence Livermore National Laboratory

PO Box 808, L-452

Livermore, CA 94551

Teléfono: (510) 422-0924

Fax: (510) 422-2282

Correo electrónico: lmascio@llnl.gov