Radiología Digital y Educación Electrónica

Ir al Departamento de Radiología y Medicina Física - Universidad de Málaga

http://radiologia.digital.uma.es

Radiología Digital y Educación Electrónica

Laboratorio de Radiología Digital y Educación Electrónica

Sistemas de archivo y comunicación de imagen

Control y gestión de calidad en radiología

Control de Calidad de Informes de Resonancia Magnética

Implantación de normas ISO en el sector radiológico

Tesis Doctoral - Esther Ristori Bogajo

Aplicaciones de la segmentación interactiva y el análisis morfométrico de nódulos en mamografía al diagnóstico asistido por ordenador

PDF de la tesis completa

Resumen:

En este trabajo se ha desarrollado un método interactivo para la segmentación de nódulos en mamografías digitales, basado en el trazado manual de su contorno por dos observadores. Se han obtenido descriptores de forma (Compacidad, Momento de Contorno y Factor de Fourier) de las imágenes segmentadas para valorar la capacidad de los observadores en la realización de esta tarea y se ha evaluado la correlación de los descriptores con diversos aspectos de cada imagen (morfología, márgenes, resultado histológico).

Además, a partir de las seis imágenes segmentadas de cada caso, 3 por cada observador, se obtuvo una imagen sumando los valores de cada una de ellas. El resultado es una imagen con 7 valores posibles por píxel, desde el 0 que indica que todas las observaciones coinciden en excluir ese píxel del nódulo, al 6 que indica que los dos observadores en sus tres observaciones han considerado ese píxel como perteneciente al nódulo. Estas imágenes se han denominado por ello, “imagen función de probabilidad” (IFP).

Introducción:

El cáncer de mama es el tumor maligno más frecuente en la mujer y constituye la primera causa de muerte por cáncer en la población femenina. Su pronóstico está relacionado con la detección precoz y por ello se han creado los Programas de cribado poblacional, o 'screening' de cáncer de mama, cuyo objetivo es explorar mediante mamografía una población de mujeres asintomáticas en edad de riesgo.

La mamografía es actualmente la técnica de elección en el screening mamario, por su capacidad de detectar lesiones que no son palpables, contribuyendo al diagnóstico precoz del cáncer de mama. Se trata de una prueba relativamente simple, con mínimos efectos adversos, aceptación generalizada y bajo coste. El screening mamográfico realizado de forma adecuada puede disminuir las tasas de mortalidad al menos un 25% ó 30 %.

El tamaño del tumor está directamente relacionado con la probabilidad de afectación linfática, de invasión vascular y de diseminación metastásica. Los signos radiográficos de un cáncer de mama de gran tamaño suelen ser claramente identificables y el interés diagnóstico se centra en aquellos hallazgos, que sugieren la existencia de un cáncer de pequeño tamaño: nódulos, distorsiones arquitecturales de pequeño tamaño, pequeñas densidades asimétricas o microcalcificaciones.

La detección precoz del cáncer de mama depende de la capacidad que tenga el radiólogo de identificar lesiones sutiles y de pequeño tamaño, que sólo son visibles si la imagen es de buena calidad. La mayor parte de los errores que se producen en la detección y caracterización de estas lesiones son debidos al uso de una técnica radiológica inadecuada, a la alta densidad de la mama explorada o a un error u omisión en la lectura de la mamografía, viéndose esta última muy influenciada por las otras dos anteriores. Los programas de cribado poblacional suelen incorporar la doble lectura, en la que dos radiólogos leen por separado las mamografías, habitualmente sin conocer el resultado del otro. Esta práctica eleva hasta un 15% el número de cánceres detectados.

En los últimos 15 años se han venido desarrollando proyectos de diagnóstico asistido por ordenador o CAD (de ‘Computer Aided Diagnosis’) para la detección automática de lesiones y la caracterización de patrones normales y anormales con el objetivo de mejorar la precisión y la consistencia diagnóstica de los radiólogos. Uno de los objetivos finales del CAD es desarrollar métodos que proporcionen un segundo observador, objetivo e infatigable, que indique al radiólogo la zona que debe revisar, preservando para éste la decisión final.

En el presente estudio se pretende utilizar la segmentación manual (interactiva) de nódulos en mamografías digitales presentadas en un monitor y la obtención de descriptores de forma de las imágenes segmentadas para valorar la capacidad de los observadores en esta tarea. Asimismo se pretende evaluar la correlación de los descriptores con diversos aspectos de cada imagen (morfología, márgenes, resultado histológico, etc.). Los objetivos concretos se enumeran a continuación:

1. Establecer una metodología de trabajo para la segmentación manual de nódulos en mamografía digital y la valoración de las imágenes segmentadas mediante descriptores de forma.

2. Desarrollar un test de imágenes que permita analizar el comportamiento de los descriptores de forma en función de cambios controlados en la forma, tamaño, orientación y bordes de la imagen.

3. Valorar la capacidad de estos descriptores para clasificar los nódulos en benignos o malignos según su morfología.

4. Utilizar esos mismos descriptores como un método que cuantifique las diferencias intra e interobservador en la segmentación manual de nódulos.

5. Incluir en el estudio mamografías digitales con resolución y profundidad de bits adecuados, en lugar de limitarse a regiones de interés.

6. Diseñar un método basado en la suma del área segmentada en una misma imagen durante varias observaciones que aporte una “función de probabilidad” de localizar el nódulo en la imagen original.

7. Crear una base de datos en las que las imágenes segmentadas varias veces, junto a los descriptores de forma y la imagen “función de probabilidad” acompañen a la original, de forma que puedan utilizarse en otros estudios.

8. Plantear las aplicaciones potenciales de esta metodología.

Material y Método:

Todas las imágenes del estudio procedían de la base de datos de mamografía de la Universidad de South Florida. Se han empleado imágenes correspondientes a mamografía completa, con un tamaño de píxel entre 42 y 50 micras. Los casos (94 nódulos contenidos en 81 mamografías) se seleccionaron utilizando el motor de búsqueda que posee la base de datos en Internet. Para obtener una representación lo más variada posible de todas las categorías, se introducía uno de los descriptores de los márgenes en el motor de búsqueda, se obtenía un listado de los casos y de las cintas en las que se encontraban y se elegía de forma aleatorizada un número determinado de casos.

Las imágenes se encontraban en formato JPEG sin pérdidas (LJPEG). Se utilizó el programa de descompresión de ficheros LJPEG de la Universidad de South Florida, el cual trabaja en entorno UNÍS (para poder realizar esta fase del estudio hubo que enviar mediante ftp los archivos a una estación de trabajo). Se descomprimieron los archivos y en ficheros con datos brutos sin cabecera (formato RAW). Los archivos descomprimidos se trajeron vía ftp al laboratorio de Radiología Digital.

Las mamografías digitales se presentaban en dos monitores colocados en paralelo. Uno de los monitores mostraba la imagen a resolución completa y el otro monitor presentaba una versión reducida de la imagen con la localización del nódulo indicada. Dos observadores (uno con experiencia en el diagnóstico mamográfico y otro sin ella) realizaron la segmentación de cada nódulo tres veces, en sesiones de trabajo independientes mediante una tableta gráfica Genius NewSketch 1812HR y un ratón de cuatro botones. Las segmentaciones se organizaron en tres sesiones que incluían la serie completa, dejando un período entre serie y serie de al menos 48 horas.

El criterio de segmentación adoptado fue delimitar el contorno del nódulo estimado por el observador con una línea blanca continua de un píxel de ancho que englobara todas las densidades consideradas como parte de él, incluyendo las espículas y tractos. En el caso de que los contornos de la lesión no pudieran seguirse de una forma clara, debía dibujarse la localización aproximada de los contornos del nódulo estimada de forma intuitiva.

Una vez realizada la segmentación, la imagen original con el contorno trazado se guardaba en formato TIFF de 8Bits, posteriormente se transformaba en una imagen binaria que se guardaba en formato TIFF (mapa de bits). Tras la obtención de la imagen binaria del nódulo se calcularon los parámetros de forma: Area, Compacidad (C), Momento de Contorno (MC) y Factor de Fourier (FF)

Ejemplo de los diferentes pasos seguidos para la obtención de los descriptores de forma en una mamografía craneocaudal, con dos nódulos en su interior.

Para valorar como actuaban los descriptores de forma ante distintas imágenes, se diseñó, por medio Adobe Photoshop 5.0 y el programa de binarización empleado con los nódulos un grupo de imágenes binarias, conteniendo objetos de dimensiones y morfología conocidas. Además se sometió a estos objetos a variaciones de tamaño, rotaciones, modificaciones del contorno de la imagen sin variar la forma y a distintos grados de deformación de la imagen para ver su influencia en los resultados. Por último, se diseñó un conjunto de imágenes consistente en un círculo al cual se le iban añadiendo espículas, con el objetivo de imitar la presencia de espículas en nódulos mamográficos y conocer su repercusión sobre los descriptores de forma.

A partir de las seis imágenes binarias de cada caso (3 por cada observador) se obtuvo una imagen sumando los valores de cada una de ellas, con 7 valores posibles por píxel, desde el 0 que indica que todas las observaciones coinciden en excluir ese píxel del nódulo, al 6 que indica que los dos observadores en sus tres observaciones han considerado ese píxel como perteneciente al nódulo. Estas imágenes se han denominado por ello, “imagen función de probabilidad” (IFP).

Los programas de obtención de imagen binaria, calculo de parámetros de forma y obtención de IFP se realizaron en Matlab 5.3.

Resultados y Discusión:

Al valorar las modificaciones de los factores de forma, utilizando los objetos diseñados para ello, en unas condiciones controladas, se observó que el MC no altera sus resultados con las modificaciones del trazado del contorno del objeto cuando se preserva la forma, pero es el factor que mayor dependencia presenta a las variaciones de la forma global del objeto. Mientras que la C y el FF se modifican menos con las alteraciones en la forma, pero son más sensibles a la irregularidad del contorno del objeto, por lo tanto estos parámetros deberán verse más influenciados por las diferencias de trazado entre dos observaciones. En la valoración de los objetos binarios que simulan imágenes espiculadas, se observa que la aparición de tan sólo una espícula modifica sustancialmente los tres parámetros de forma, esto tiene importancia a la hora de considerar que si en una observación se incluye un apéndice en el contorno de una imagen redondeada u oval y en otra no, los resultados van a diferir de forma importante.

Uno de los objetivos del presente estudio era valorar la variación existente inter e intraobservador utilizando los parámetros de forma. Los resultados mostraron diferencias significativas entre ambos observadores en un tercio de los casos para la C y el FF en los que los valores del observador con menor experiencia son superiores a los del otro observador. Para el MC ocurre algo similar pero en menos del 25% de los casos. Puesto que la C y el FF presentan mayor sensibilidad a la irregularidad del trazado, esto indica que el observador con menor experiencia realiza un trazado más irregular y que, sin embargo, la forma presenta menos diferencias entre ambos observadores.

Además, se observó que existen diferencias intraobservador en la segmentación de nódulos, que se traducen en cierto grado de dispersión de los parámetros de forma y de falta de correlación entre las diferentes series. Estas diferencias son más importantes y frecuentes en el MC que en los restantes parámetros, lo que sugiere que hay mayor dispersión en la forma de la imagen segmentada que en el detalle del contorno. Por otro lado, de este estudio se desprende que las imágenes segmentadas de cada caso por el observador experto son morfológicamente más parecidas entre sí que aquellas segmentadas por el observador con menos experiencia.

Si se utiliza como dato la media de las seis observaciones, los tres parámetros de forma muestran capacidad de diferenciar los nódulos con resultado histológico benigno y maligno (sobre todo con la C y el FF). Considerando los observadores independientemente la capacidad de discriminación de las lesiones en benignas y malignas disminuye , los tres parámetros de forma permiten diferenciar aquellos nódulos con valoración 5 (lesión maligna) de los valorados como 4 (probablemente maligna) y tres (probablemente benigna). En cambio la comparación de los nódulos valorados como probablemente benignos o probablemente malignos muestran resultados superpuestos.

El uso de los parámetros de forma C y FF, permiten diferenciar entre nódulos márgenes espiculados y mal definidos de los nódulos que presentan otro tipo de margen. Además el MC permite diferenciar entre los nódulos con márgenes mal definidos y los restantes. Sin embargo esta parte del estudio nos ha planteado la necesidad de aumentar el número de casos con determinados márgenes (por ejemplo nódulos con márgenes ocultos y parcialmente ocultos), para poder obtener resultados más concluyentes.

Respecto a la forma de los nódulos los resultados muestran que los parámetros de forma permiten diferenciar dos grupos distintos, por un lado divide a los nódulos clasificados como distorsión arquitectural y en otro grupo claramente diferenciado, los nódulos con forma lobulada, oval y redondeada. Los nódulos irregulares presentan mayor dispersión de datos y sólo la Compacidad los diferencia con cierta claridad del segundo grupo. Sin embargo como también se vio en el apartado anterior, existen grupos de nódulos (distorsión arquitectural y redondeado), en los que sería importante añadir más casos para poder obtener resultados más concluyentes.

Uno de los resultados más prometedores de este estudio ha sido la creación de una base de datos con la imagen original en formato raw, las seis imágenes binarias obtenidas de las tres segmentaciones que realizaron cada observador de cada nódulo, los parámetros de forma obtenidos de cada nódulo y la IFP de cada caso. Las IFP se encuentran almacenadas en mapa de bits y tienen el mismo tamaño que la imagen original de la mamografía, lo que significa que la IFP de cada nódulo tiene la misma localización que el propio nódulo en la imagen original.

Conclusiones:

1. Se ha desarrollado un método interactivo para la segmentación de nódulos en mamografías digitalizadas, basado en el trazado manual de su contorno y el análisis morfométrico mediante tres descriptores de forma normalizados: Compacidad, Momento de Contorno y Factor de Fourier. Se ha aplicado dicho método a 94 nódulos de características variadas e histología comprobada, utilizando dos observadores independientes.

2. La metodología de segmentación empleada es sencilla y reproducible. El tiempo requerido para cada segmentación depende de las características del nódulo y de la práctica adquirida con el sistema de segmentación. En un 60% de los casos se ha necesitado menos de 2 minutos para su segmentación.

3. Se presenta, como propuesta original, la creación de imágenes que expresan la probabilidad de pertenencia de cada píxel al nódulo, obtenidas a partir de las diferentes imágenes binarias segmentadas. A estas imágenes se las ha denominado “imágenes de función de probabilidad” (IFP).

4. Los resultados obtenidos muestran que el Momento de Contorno depende de la forma global del objeto y es prácticamente insensible frente a irregularidades debidas al trazado del contorno. En cambio, la Compacidad y Factor de Fourier son más sensibles a estas irregularidades y se modifican menos con las alteraciones en la forma global.

5. Se ha demostrado que existen diferencias tanto intra como interobservador utilizando los parámetros de forma y las IFP. Los parámetros de forma permiten valorar globalmente las distintas imágenes de un nódulo segmentado, mientras que las imágenes función de probabilidad muestran la localización concreta de las discrepancias entre observaciones.

6. Las diferencias intraobservador son mayores y más frecuentes en el Momento de Contorno que en los restantes parámetros, lo que sugiere que hay mayor dispersión en la forma de la imagen segmentada que en el detalle del contorno. El observador, con experiencia previa en mamografía, ha mostrado un menor grado de diferencias intraobservador que el observador, sin experiencia en mamografía.

7. La incorporación de un apéndice en el contorno de una imagen redondeada u oval introduce importantes modificaciones en los parámetros de forma, especialmente en el Momento de Contorno. Este hecho explica algunas diferencias apreciables en los resultados obtenidos con segmentaciones del mismo nódulo.

8. Cada uno de los tres parámetros de forma permiten diferenciar los nódulos de histología maligna y benigna cuando se utiliza la media de las seis observaciones. Si se emplean los resultados de un sólo observador la capacidad de discriminación se reduce.

9. Se ha encontrado que los parámetros de forma no discriminan claramente los nódulos valorados como probablemente malignos de los valorados como probablemente benignos, pero permiten diferenciarlos según la forma y los márgenes, aunque sería conveniente aumentar el número de casos con algunas características concretas para poder obtener resultados más concluyentes.

10. Los resultados han demostrado que tomar una sola segmentación manual como referencia para evaluar sistemas automáticos de segmentación es insuficiente, pues la segmentación reiteradas veces de un nódulo deja zonas de incertidumbre que deben ser consideradas.

11. Se ha desarrollado una base de datos, constituida por la imagen original, las imágenes segmentadas, los parámetros de forma y las IFP que constituye un banco de pruebas robusto para un sistema de segmentación automática de nódulos.

12. El grado de aceptabilidad y la aplicación práctica de este estudio puede beneficiarse de la re-evaluación de los casos y de otras modificaciones como aumentar el número de imágenes en el estudio e incorporar radiólogos con experiencia en mamografía.

Departamento de Radiología y Medicina Física. Facultad de Medicina. Bulevar Louis Pasteur, 32. 29071Málaga. Teléfono 952131651-53. Fax 952131630.

Diseño y realización de este sitio web: Francisco Sendra Portero (Optimizado a 800 x 600)


Envíe sus recomendaciones y sugerencias sobre esta página	Última revisión: diciembre 09, 2009