PDF
de la tesis completa
Resumen:
En este trabajo se ha desarrollado un método
interactivo para la segmentación de nódulos en mamografías digitales,
basado en el trazado manual de su contorno por dos observadores. Se han
obtenido descriptores de forma (Compacidad, Momento de Contorno y Factor
de Fourier) de las imágenes segmentadas para valorar la capacidad de los
observadores en la realización de esta tarea y se ha evaluado la
correlación de los descriptores con diversos aspectos de cada imagen
(morfología, márgenes, resultado histológico).
Además, a partir de las seis imágenes
segmentadas de cada caso, 3 por cada observador, se obtuvo una imagen
sumando los valores de cada una de ellas. El resultado es una imagen con
7 valores posibles por píxel, desde el 0 que indica que todas las
observaciones coinciden en excluir ese píxel del nódulo, al 6 que indica
que los dos observadores en sus tres observaciones han considerado ese
píxel como perteneciente al nódulo. Estas imágenes se han denominado por
ello, “imagen función de probabilidad” (IFP).
Introducción:
El cáncer de mama es el tumor maligno más
frecuente en la mujer y constituye la primera causa de muerte por cáncer
en la población femenina. Su pronóstico está relacionado con la
detección precoz y por ello se han creado los Programas de cribado
poblacional, o 'screening' de cáncer de mama, cuyo objetivo es explorar
mediante mamografía una población de mujeres asintomáticas en edad de
riesgo.
La mamografía es actualmente la técnica de
elección en el screening mamario, por su capacidad de detectar lesiones
que no son palpables, contribuyendo al diagnóstico precoz del cáncer de
mama. Se trata de una prueba relativamente simple, con mínimos efectos
adversos, aceptación generalizada y bajo coste. El screening mamográfico
realizado de forma adecuada puede disminuir las tasas de mortalidad al
menos un 25% ó 30 %.
El tamaño del tumor está directamente
relacionado con la probabilidad de afectación linfática, de invasión
vascular y de diseminación metastásica. Los signos radiográficos de un
cáncer de mama de gran tamaño suelen ser claramente identificables y el
interés diagnóstico se centra en aquellos hallazgos, que sugieren la
existencia de un cáncer de pequeño tamaño: nódulos, distorsiones
arquitecturales de pequeño tamaño, pequeñas densidades asimétricas o
microcalcificaciones.
La detección precoz del cáncer de mama
depende de la capacidad que tenga el radiólogo de identificar lesiones
sutiles y de pequeño tamaño, que sólo son visibles si la imagen es de
buena calidad. La mayor parte de los errores que se producen en la
detección y caracterización de estas lesiones son debidos al uso de una
técnica radiológica inadecuada, a la alta densidad de la mama explorada
o a un error u omisión en la lectura de la mamografía, viéndose esta
última muy influenciada por las otras dos anteriores. Los programas de
cribado poblacional suelen incorporar la doble lectura, en la que dos
radiólogos leen por separado las mamografías, habitualmente sin conocer
el resultado del otro. Esta práctica eleva hasta un 15% el número de
cánceres detectados.
En los últimos 15 años se han venido
desarrollando proyectos de diagnóstico asistido por ordenador o CAD (de
‘Computer Aided Diagnosis’) para la detección automática de lesiones y
la caracterización de patrones normales y anormales con el objetivo de
mejorar la precisión y la consistencia diagnóstica de los radiólogos.
Uno de los objetivos finales del CAD es desarrollar métodos que
proporcionen un segundo observador, objetivo e infatigable, que indique
al radiólogo la zona que debe revisar, preservando para éste la decisión
final.
En el presente estudio se pretende utilizar
la segmentación manual (interactiva) de nódulos en mamografías digitales
presentadas en un monitor y la obtención de descriptores de forma de las
imágenes segmentadas para valorar la capacidad de los observadores en
esta tarea. Asimismo se pretende evaluar la correlación de los
descriptores con diversos aspectos de cada imagen (morfología, márgenes,
resultado histológico, etc.). Los objetivos concretos se enumeran a
continuación:
1.
Establecer una metodología de trabajo para la segmentación manual
de nódulos en mamografía digital y la valoración de las imágenes
segmentadas mediante descriptores de forma.
2.
Desarrollar un test de imágenes que permita analizar el
comportamiento de los descriptores de forma en función de cambios
controlados en la forma, tamaño, orientación y bordes de la imagen.
3.
Valorar la capacidad de estos descriptores para clasificar los
nódulos en benignos o malignos según su morfología.
4.
Utilizar esos mismos descriptores como un método que cuantifique
las diferencias intra e interobservador en la segmentación manual de
nódulos.
5.
Incluir en el estudio mamografías digitales con resolución y
profundidad de bits adecuados, en lugar de limitarse a regiones de
interés.
6.
Diseñar un método basado en la suma del área segmentada en una
misma imagen durante varias observaciones que aporte una “función de
probabilidad” de localizar el nódulo en la imagen original.
7.
Crear una base de datos en las que las imágenes segmentadas
varias veces, junto a los descriptores de forma y la imagen “función de
probabilidad” acompañen a la original, de forma que puedan utilizarse en
otros estudios.
8.
Plantear las aplicaciones potenciales de esta metodología.
Material y Método:
Todas las imágenes del estudio procedían de
la base de datos de mamografía de la Universidad de South Florida. Se
han empleado imágenes correspondientes a mamografía completa, con un
tamaño de píxel entre 42 y 50 micras. Los casos (94 nódulos contenidos
en 81 mamografías) se seleccionaron utilizando el motor de búsqueda que
posee la base de datos en Internet. Para obtener una representación lo
más variada posible de todas las categorías, se introducía uno de los
descriptores de los márgenes en el motor de búsqueda, se obtenía un
listado de los casos y de las cintas en las que se encontraban y se
elegía de forma aleatorizada un número determinado de casos.
Las imágenes se encontraban en formato JPEG
sin pérdidas (LJPEG). Se utilizó el programa de descompresión de
ficheros LJPEG de la Universidad de South Florida, el cual trabaja en
entorno UNÍS (para poder realizar esta fase del estudio hubo que enviar
mediante ftp los archivos a una estación de trabajo). Se descomprimieron
los archivos y en ficheros con datos brutos sin cabecera (formato RAW).
Los archivos descomprimidos se trajeron vía ftp al laboratorio de
Radiología Digital.
Las mamografías digitales se presentaban en
dos monitores colocados en paralelo. Uno de los monitores mostraba la
imagen a resolución completa y el otro monitor presentaba una versión
reducida de la imagen con la localización del nódulo indicada. Dos
observadores (uno con experiencia en el diagnóstico mamográfico y otro
sin ella) realizaron la segmentación de cada nódulo tres veces, en
sesiones de trabajo independientes mediante una tableta gráfica Genius
NewSketch 1812HR y un ratón de cuatro botones. Las segmentaciones se
organizaron en tres sesiones que incluían la serie completa, dejando un
período entre serie y serie de al menos 48 horas.
El criterio de segmentación adoptado fue
delimitar el contorno del nódulo estimado por el observador con una
línea blanca continua de un píxel de ancho que englobara todas las
densidades consideradas como parte de él, incluyendo las espículas y
tractos. En el caso de que los contornos de la lesión no pudieran
seguirse de una forma clara, debía dibujarse la localización aproximada
de los contornos del nódulo estimada de forma intuitiva.
Una vez realizada la segmentación, la imagen
original con el contorno trazado se guardaba en formato TIFF de 8Bits,
posteriormente se transformaba en una imagen binaria que se guardaba en
formato TIFF (mapa de bits). Tras la obtención de la imagen binaria del
nódulo se calcularon los parámetros de forma: Area, Compacidad (C),
Momento de Contorno (MC) y Factor de Fourier (FF)
Ejemplo de los diferentes pasos seguidos
para la obtención de los descriptores de forma en una mamografía
craneocaudal, con dos nódulos en su interior.
Para valorar como actuaban los descriptores
de forma ante distintas imágenes, se diseñó, por medio Adobe Photoshop
5.0 y el programa de binarización empleado con los nódulos un grupo de
imágenes binarias, conteniendo objetos de dimensiones y morfología
conocidas. Además se sometió a estos objetos a variaciones de tamaño,
rotaciones, modificaciones del contorno de la imagen sin variar la forma
y a distintos grados de deformación de la imagen para ver su influencia
en los resultados. Por último, se diseñó un conjunto de imágenes
consistente en un círculo al cual se le iban añadiendo espículas, con el
objetivo de imitar la presencia de espículas en nódulos mamográficos y
conocer su repercusión sobre los descriptores de forma.
A partir de las seis imágenes binarias de
cada caso (3 por cada observador) se obtuvo una imagen sumando los
valores de cada una de ellas, con 7 valores posibles por píxel, desde el
0 que indica que todas las observaciones coinciden en excluir ese píxel
del nódulo, al 6 que indica que los dos observadores en sus tres
observaciones han considerado ese píxel como perteneciente al nódulo.
Estas imágenes se han denominado por ello, “imagen función de
probabilidad” (IFP).
Los programas de obtención de imagen
binaria, calculo de parámetros de forma y obtención de IFP se realizaron
en Matlab 5.3.
Resultados y Discusión:
Al valorar las modificaciones de los
factores de forma, utilizando los objetos diseñados para ello, en unas
condiciones controladas, se observó que el MC no altera sus resultados
con las modificaciones del trazado del contorno del objeto cuando se
preserva la forma, pero es el factor que mayor dependencia presenta a
las variaciones de la forma global del objeto. Mientras que la C y el FF
se modifican menos con las alteraciones en la forma, pero son más
sensibles a la irregularidad del contorno del objeto, por lo tanto estos
parámetros deberán verse más influenciados por las diferencias de
trazado entre dos observaciones. En la valoración de los objetos
binarios que simulan imágenes espiculadas, se observa que la aparición
de tan sólo una espícula modifica sustancialmente los tres parámetros de
forma, esto tiene importancia a la hora de considerar que si en una
observación se incluye un apéndice en el contorno de una imagen
redondeada u oval y en otra no, los resultados van a diferir de forma
importante.
Uno de los objetivos del presente estudio
era valorar la variación existente inter e intraobservador utilizando
los parámetros de forma. Los resultados mostraron diferencias
significativas entre ambos observadores en un tercio de los casos para
la C y el FF en los que los valores del observador con menor experiencia
son superiores a los del otro observador. Para el MC ocurre algo similar
pero en menos del 25% de los casos. Puesto que la C y el FF presentan
mayor sensibilidad a la irregularidad del trazado, esto indica que el
observador con menor experiencia realiza un trazado más irregular y que,
sin embargo, la forma presenta menos diferencias entre ambos
observadores.
Además, se observó que existen diferencias
intraobservador en la segmentación de nódulos, que se traducen en cierto
grado de dispersión de los parámetros de forma y de falta de correlación
entre las diferentes series. Estas diferencias son más importantes y
frecuentes en el MC que en los restantes parámetros, lo que sugiere que
hay mayor dispersión en la forma de la imagen segmentada que en el
detalle del contorno. Por otro lado, de este estudio se desprende que
las imágenes segmentadas de cada caso por el observador experto son
morfológicamente más parecidas entre sí que aquellas segmentadas por el
observador con menos experiencia.
Si se utiliza como dato la media de las seis
observaciones, los tres parámetros de forma muestran capacidad de
diferenciar los nódulos con resultado histológico benigno y maligno
(sobre todo con la C y el FF). Considerando los observadores
independientemente la capacidad de discriminación de las lesiones en
benignas y malignas disminuye , los tres parámetros de forma permiten
diferenciar aquellos nódulos con valoración 5 (lesión maligna) de los
valorados como 4 (probablemente maligna) y tres (probablemente benigna).
En cambio la comparación de los nódulos valorados como probablemente
benignos o probablemente malignos muestran resultados superpuestos.
El uso de los parámetros de forma C y FF,
permiten diferenciar entre nódulos márgenes espiculados y mal definidos
de los nódulos que presentan otro tipo de margen. Además el MC permite
diferenciar entre los nódulos con márgenes mal definidos y los
restantes. Sin embargo esta parte del estudio nos ha planteado la
necesidad de aumentar el número de casos con determinados márgenes (por
ejemplo nódulos con márgenes ocultos y parcialmente ocultos), para poder
obtener resultados más concluyentes.
Respecto a la forma de los nódulos los
resultados muestran que los parámetros de forma permiten diferenciar dos
grupos distintos, por un lado divide a los nódulos clasificados como
distorsión arquitectural y en otro grupo claramente diferenciado, los
nódulos con forma lobulada, oval y redondeada. Los nódulos irregulares
presentan mayor dispersión de datos y sólo la Compacidad los diferencia
con cierta claridad del segundo grupo. Sin embargo como también se vio
en el apartado anterior, existen grupos de nódulos (distorsión
arquitectural y redondeado), en los que sería importante añadir más
casos para poder obtener resultados más concluyentes.
Uno de los resultados más prometedores
de este estudio ha sido la creación de una base de datos con la imagen
original en formato raw, las seis imágenes binarias obtenidas de las
tres segmentaciones que realizaron cada observador de cada nódulo, los
parámetros de forma obtenidos de cada nódulo y la IFP de cada caso. Las
IFP se encuentran almacenadas en mapa de bits y tienen el mismo tamaño
que la imagen original de la mamografía, lo que significa que la IFP de
cada nódulo tiene la misma localización que el propio nódulo en la
imagen original.
Conclusiones:
1.
Se ha desarrollado un método interactivo para la segmentación de
nódulos en mamografías digitalizadas, basado en el trazado manual de su
contorno y el análisis morfométrico mediante tres descriptores de forma
normalizados: Compacidad, Momento de Contorno y Factor de Fourier. Se ha
aplicado dicho método a 94 nódulos de características variadas e
histología comprobada, utilizando dos observadores independientes.
2.
La metodología de segmentación empleada es sencilla y
reproducible. El tiempo requerido para cada segmentación depende de las
características del nódulo y de la práctica adquirida con el sistema de
segmentación. En un 60% de los casos se ha necesitado menos de 2 minutos
para su segmentación.
3.
Se presenta, como propuesta original, la creación de imágenes que
expresan la probabilidad de pertenencia de cada píxel al nódulo,
obtenidas a partir de las diferentes imágenes binarias segmentadas. A
estas imágenes se las ha denominado “imágenes de función de
probabilidad” (IFP).
4.
Los resultados obtenidos muestran que el Momento de Contorno
depende de la forma global del objeto y es prácticamente insensible
frente a irregularidades debidas al trazado del contorno. En cambio, la
Compacidad y Factor de Fourier son más sensibles a estas irregularidades
y se modifican menos con las alteraciones en la forma global.
5.
Se ha demostrado que existen diferencias tanto intra como
interobservador utilizando los parámetros de forma y las IFP. Los
parámetros de forma permiten valorar globalmente las distintas imágenes
de un nódulo segmentado, mientras que las imágenes función de
probabilidad muestran la localización concreta de las discrepancias
entre observaciones.
6.
Las diferencias intraobservador son mayores y más frecuentes en
el Momento de Contorno que en los restantes parámetros, lo que sugiere
que hay mayor dispersión en la forma de la imagen segmentada que en el
detalle del contorno. El observador, con experiencia previa en
mamografía, ha mostrado un menor grado de diferencias intraobservador
que el observador, sin experiencia en mamografía.
7.
La incorporación de un apéndice en el contorno de una imagen
redondeada u oval introduce importantes modificaciones en los parámetros
de forma, especialmente en el Momento de Contorno. Este hecho explica
algunas diferencias apreciables en los resultados obtenidos con
segmentaciones del mismo nódulo.
8.
Cada uno de los tres parámetros de forma permiten diferenciar los
nódulos de histología maligna y benigna cuando se utiliza la media de
las seis observaciones. Si se emplean los resultados de un sólo
observador la capacidad de discriminación se reduce.
9.
Se ha encontrado que los parámetros de forma no discriminan
claramente los nódulos valorados como probablemente malignos de los
valorados como probablemente benignos, pero permiten diferenciarlos
según la forma y los márgenes, aunque sería conveniente aumentar el
número de casos con algunas características concretas para poder obtener
resultados más concluyentes.
10.
Los resultados han demostrado que tomar una sola segmentación
manual como referencia para evaluar sistemas automáticos de segmentación
es insuficiente, pues la segmentación reiteradas veces de un nódulo deja
zonas de incertidumbre que deben ser consideradas.
11.
Se ha desarrollado una base de datos, constituida por la imagen
original, las imágenes segmentadas, los parámetros de forma y las IFP
que constituye un banco de pruebas robusto para un sistema de
segmentación automática de nódulos.
12.
El grado de aceptabilidad y la aplicación práctica de este
estudio puede beneficiarse de la re-evaluación de los casos y de otras
modificaciones como aumentar el número de imágenes en el estudio e
incorporar radiólogos con experiencia en mamografía.
|