Evaluación de imágenes de microscopía usando algoritmos de Machine Learning para detección de células individuales y colonias de bacterias en raíces
Fecha
2021-04-16Autor(es)
Chaves Tequia, Luis MiguelPublicador
Pontificia Universidad Javeriana
Facultad
Facultad de Ingeniería
Facultad de Ciencias Económicas y Administrativas
Programa
Maestría en Analítica para la Inteligencia de Negocios
Título obtenido
Magíster en Analítica para la Inteligencia de Negocios
Tipo
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaCompartir este registro
Citación
Documentos PDF
Título en inglés
Microscopy image evaluation using Machine Learning algorithms for detection of single cells and bacterial colonies in rootsResumen
La capacidad de los microorganismos para colonizar diferentes tipos de superficies e interactuar química y biológicamente con el medio que colonizan ha sido objeto de estudio por años. Un ejemplo de ello es la gran cantidad de proyectos y publicaciones sobre el efecto de las colonizaciones en la salud humana, en la bioprotección de superficies rocosas en estructuras de interés cultural, en biopesticidas, en la degradación de plásticos en ecosistemas marinos y en la biofertilización y bioestimulación de plantas. Técnicas como FISH (Fluorescent in situ hybridization) ó CARD-FISH (catalyzed-reporter deposition- FISH), y la posterior microscopía de fluorescencia o confocal, conforman una sinergia de métodos disponibles para detectar y monitorear la presencia de microorganismos de interés en diferentes ambientes, como es el caso de las raíces de las plantas. Este estudio utiliza una colección de imágenes obtenida del proyecto doctoral “Promoción de crecimiento vegetal de Bacillus subtilis EA-CB0575, colonización rizosférica y potencial genómico y bioquímico”, en el cual se evaluó la colonización de la cepa Bacillus subtilis EA-CB0575, un promotor de crecimiento vegetal en cultivos de interés económico. La finalidad de esta colección de imágenes era evaluar la presencia del microorganismo enunciado en las raíces de las especies vegetales evaluadas (banano, Musa AAA var. Williams y tomate, Lycospersicum esculentum var. Chonto) y monitorear a Bacillus subtilis por medio del uso de una o varias sondas de fluorescencia; generando imágenes donde las células de interés, fluoresciendo debido al proceso realizado, se contrastan de forma notoria con el fondo negro o de baja fluorescencia. Esta investigación se dividió en dos fases; la primera consistió en el diseño de un algoritmo, ejecutado por el equipo de trabajo. Este algoritmo resultante se denominó MSA, y tiene como finalidad segmentar imágenes con las características de fluorescencia ya mencionadas. La segunda fase consistió en la segmentación de las imágenes por parte de los algoritmos supervisados RATS, RATS L, Detección de bordes, LOCAL, Isodata, y el entrenamiento no supervisado para la definición de parámetros del algoritmo Canny, algunos de ellos implementados en software ya existente y disponible para análisis de imágenes de microscopía como DAIME e Image J.
El algoritmo que obtiene la menor diferencia entre el conteo de células por parte del experto y la segmentación de las regiones de interés fue el algoritmo de detección de bordes Canny con un valor RMSE de 67,8.Por otra parte, bajo la métrica del error MAE y la medida de exactitud el algoritmo que utiliza un valor de umbral global RATS obtiene el mejor desempeño, la precisión más alta la obtiene el algoritmo Canny (84%), y la sensibilidad más alta (43%) la obtiene el algoritmo Detección de bordes. El desempeño del algoritmo MSA fue positivo, ya que en todas las medidas definidas estuvo por encima del promedio, el mejor desempeño lo obtuvo en la medida de precisión (71,4%). Durante el desarrollo de esta investigación se evidenció la subjetividad y el sesgo que existe en el análisis de las imágenes, ya que para el mismo experto es difícil replicar los resultados en el conteo de células hechos con anterioridad. Por esta razón, la metodología aquí planteada es una alternativa para eliminar la subjetividad y convertir el análisis de imágenes de microscopía de en un proceso que permita reproducibilidad de los resultados.
Abstract
The ability of microorganisms to colonize different types of surfaces and interact chemically and biologically with the medium they colonize has been object of study for years. An example of this is the large number of projects and publications on the effect of colonizations on human health, on the bioprotection of rocky surfaces in structures of cultural interest, on biopesticides, on the degradation of plastics in marine ecosystems and on biofertilization and biostimulation of plants. Techniques such as FISH (Fluorescent in situ hybridization) or CARD-FISH (catalyzed-reporter deposition- FISH), and the subsequent fluorescence or confocal microscopy, make up a synergy of available methods to detect and monitor the presence of microorganisms of interest in different environments. , as is the case with the roots of plants. This study uses a collection of images obtained from the doctoral project "Promotion of plant growth of Bacillus subtilis EA-CB0575, rhizospheric colonization and genomic and biochemical potential", in which the colonization of the strain Bacillus subtilis EA-CB0575, a promoter of plant growth in crops of economic interest. The purpose of this collection of images was to evaluate the presence of the stated microorganism in the roots of the evaluated plant species (banana, Musa AAA var. Williams and tomato, Lycospersicum esculentum var. Chonto) and to monitor Bacillus subtilis through the use of a or several fluorescence probes; generating images where the cells of interest, fluorescing due to the process carried out, are clearly contrasted with the black or low fluorescence background. This investigation was divided into two phases; the first consisted of the design of an algorithm, executed by the work team. This resulting algorithm was called MSA, and its purpose is to segment images with the aforementioned fluorescence characteristics. The second phase consisted of the segmentation of the images by the supervised algorithms RATS, RATS L, Edge Detection, LOCAL, Isodata, and the unsupervised training for the definition of parameters of the Canny algorithm, some of them implemented in software already existing and available for microscopy image analysis as DAIME and Image J.
The algorithm that obtained the smallest difference between the cell count by the expert and the segmentation of the regions of interest was the Canny edge detection algorithm with an RMSE value of 67.8, on the other hand, under the error metric MAE and the measure of accuracy the algorithm that uses a global threshold value RATS obtains the best performance, the highest precision is obtained by the Canny algorithm (84%), and the highest sensitivity (43%) is obtained by the Detection algorithm. edges. The performance of the MSA algorithm was positive, since in all the defined measures it was above the average, the best performance was obtained in the precision measure (71.4%). During the development of this research, the subjectivity and bias that exists in the analysis of the images was evidenced, since for the same expert it is difficult to replicate the results in the cell count made previously. For this reason, the methodology proposed here is an alternative to eliminate subjectivity and turn the analysis of microscopy images into a process that allows reproducibility of the results.
Cobertura espacial (Ciudades)
Bogotá (Colombia)Cobertura espacial (Municipios de Colombia)
Bogotá, D.C. (Bogotá, Colombia)Cobertura espacial (Departamentos de Colombia)
Cundinamarca (Colombia)Cobertura espacial
ColombiaCobertura temporal
2020-2021Temas
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicasRedes neuronales (Computadores)
Aprendizaje automático (Inteligencia artificial)
Algoritmos (Computadores)
Estadísticas Google Analytics