BASES DE DATOS DE MAMOGRAFÍA 

 

 DIGITAL.
 
ESTUDIO COMPARATIVO

Esther Ristori Bogajo, Francisco Sendra Portero, 

 Enrique Nava Baro, Manuel Martínez Morillo

                                                                  

 

Digital Database for Screening Mammography(DDSM) University of South Florida

Esta base de datos es la más completa, se actualiza con mucha frecuencia. En septiembre de 1999 contaba con 9556 imágenes mamográficas, actualmente (marzo de 2000) la constituyen 10480 imágenes, correspondientes a 2620 casos. Pretende reproducir una casuística completa de 'screening' de mama para aplicarla incluso a estudios de detección y aprendizaje. Todos los casos están clasificados según el sistema BI-RADS del ACR. Se organizan en cuatro tipos de volúmenes para facilitar la clasificación:

  • Normal (12 volúmenes, 695 casos)

  • Cáncer (15 volúmenes, 914 casos)

  • Benigna (14 volúmenes, 870 casos)

  • Benigna sin rellamada (2 volúmenes, 141 casos)

1.2 Contenido de cada caso: Cada caso posee cuatro imágenes que pertenecen a dos proyecciones de cada mama (OML y CC) e información adicional asociada al caso. El contenido de cada caso está organizado en un directorio que incluye diferentes tipos de archivo.

Archivo ".ics". Aporta información adjunta a cada caso:
  • Fecha del estudio

  • Edad de la paciente

  • Fecha de digitalización de las imágenes

  • Tipo de digitalizador utilizado

  • Lista de los archivos de imagen

  • Clasificación de la densidad de la mama (según ACR)

Archivo ".LJPEG". Las cuatro imágenes del caso se almacenan con un formato jpeg sin pérdidas (lossless jpeg).

Archivos ".overlay". Cada caso posee entre uno a cuatro archivos ".overlay". Son ficheros que contienen la siguiente información correspondiente a una imagen:
  • El número de anormalidades presentes.

  • El tipo de lesión según el BI-RADS

  • La categoría de la lesión, de 1 a 5, según BI-RADS

  • El grado de sutileza. Valoración independiente del BI-RADS, que indica el grado de dificultad de detección de la lesión de 1(sutil) a 5 (obvio).

  • El resultado histopatológico

  • La descripción del contorno del hallazgo marcado como anormal. Cada contorno se especifica como una cadena código.

Los casos normales no tienen fichero ".overlay".

Archivos ".16_PGM". Son cuatro imágenes concatenadas a baja resolución, almacenados en PGM (portable gray map) a 16 bits. Permite una visión rápida de las imágenes del caso

Características de las imágenes: Todas las imágenes han sido digitalizadas mediante escáner láser. El tamaño del pixel, así como los niveles de gris, dependen del escáner utilizado para digitalizar las imágenes.

  • DBA: 42 μm, 16 bits

  • HOWTEK: 43,5 μm, 12 bits

  • LUMISYS: 50 μm, 12bits.

El formato ".ljpeg" puede leerse mediante software de la USF, que funciona en entorno Unix. Para visualizarlos en entorno PC hay que convertir el formato a otro más estándar.

Adquisición e información sobre la base de datos: Pueden adquirirse uno o varios volúmenes en cintas EXABYTE de 8mm o pueden descargarse vía ftp anónimo. El precio ronda los 20-30 $ por volumen. La forma de adquisición, así como una amplísima información sobre la base de datos puede encontrarse en

http://marathon.csee.usf.edu/Mammography/Database.html

Merece destacarse otros aspectos interesantes de un website muy elaborado, contiene un motor de búsquedas según el tipo de caso y la posibilidad de visualizar cada uno de ellos en páginas tipo "thumbnails" con la información correspondiente (Tabla 1).

Digital Database for Screening Mammography

Volume: cancer_01 Case: C-0001-1