Alto
HogarHogar > Noticias > Alto

Alto

Jul 07, 2023

Nature Biotechnology (2023)Citar este artículo

Accesos 24k

5 citas

172 Altmetric

Detalles de métricas

Los cultivos bacterianos puros siguen siendo esenciales para los estudios mecanicistas y experimentales detallados en la investigación del microbioma, y ​​los métodos tradicionales para aislar bacterias individuales de ecosistemas microbianos complejos requieren mucha mano de obra, son difíciles de escalar y carecen de integración fenotipo-genotipo. Aquí describimos una plataforma de aislamiento de cepas robóticas de alto rendimiento de código abierto para la generación rápida de aislamientos bajo demanda. Desarrollamos un enfoque de aprendizaje automático que aprovecha la morfología de las colonias y los datos genómicos para maximizar la diversidad de microbios aislados y permitir la selección selectiva de géneros específicos. La aplicación de esta plataforma en muestras fecales de 20 humanos produce biobancos de microbiomas intestinales personalizados con un total de 26 997 aislamientos que representan >80 % de todos los taxones abundantes. El análisis espacial de más de 100 000 colonias capturadas visualmente revela patrones de crecimiento conjunto entre las familias Ruminococcaceae, Bacteroidaceae, Coriobacteriaceae y Bifidobacteriaceae que sugieren importantes interacciones microbianas. El análisis comparativo de 1.197 genomas de alta calidad de estos biobancos muestra una interesante evolución intra e interpersonal de cepas, selección y transferencia horizontal de genes. Este marco de culturómica debería potenciar nuevos esfuerzos de investigación para sistematizar la recopilación y el análisis cuantitativo de fenotipos basados ​​en imágenes con datos genómicos de alta resolución para muchos estudios de microbiomas emergentes.

La metagenómica ofrece la capacidad de estudiar ampliamente la composición de diversos ecosistemas microbianos que van desde las comunidades del suelo hasta el microbioma intestinal. Sin embargo, los microbios deben aislarse y cultivarse para diseccionar mecánicamente sus roles funcionales en el hábitat y la miríada de procesos entre especies que ocurren. Los métodos de cultivo tradicionales que se basan en la recolección aleatoria de colonias por 'fuerza bruta' son tediosos y laboriosos1,2,3,4. Los métodos de aislamiento basados ​​en diluciones en serie que utilizan pozos de 96 o 384 requieren muchos recursos y dan como resultado el aislamiento repetido de las mismas cepas dominantes de la población5. Los sistemas de microfluidos permiten el crecimiento en reactores de nanolitros, pero los aislamientos clonales son difíciles de extraer6,7. Dado que un microbioma típico puede contener de cientos a miles de especies únicas que exhiben una distribución de abundancia de cola larga8 (es decir, pocas dominan mientras que la mayoría son raras), la generación de colecciones completas de cepas a través de la culturómica sistemática sigue siendo un desafío importante y sobresaliente.

Los microbios se pueden distinguir en función de sus diversos fenotipos, ya sea por su capacidad para crecer en determinados medios o por los metabolitos que producen9,10,11,12. La selección basada en el crecimiento puede mejorar el aislamiento de especies raras, por ejemplo, con medios de crecimiento que contengan diferentes nutrientes o antibióticos1,2,13. Los espectros de espectrometría de masas se pueden utilizar para diferenciar entre especies14,15, pero el enfoque es de bajo rendimiento y requiere procesamiento manual. La clasificación de células activada por imágenes se ha desarrollado para aislar células eucariotas basándose en imágenes multidimensionales, pero este método requiere instrumentación sofisticada y no se ha implementado para bacterias16. Con los avances recientes en inteligencia artificial (IA) y modelos de aprendizaje profundo entrenados para discernir características matizadas en imágenes multidimensionales y datos biológicos17, el aprendizaje automático (ML) de flujos de datos genómicos y fenotípicos combinados está preparado para transformar la culturómica microbiana de próxima generación.

Aquí describimos una plataforma de genotipado y aislamiento de cepas robóticas guiada por ML que permite la generación rápida y de alto rendimiento de biobancos cultivados bajo demanda. Este sistema utiliza un algoritmo inteligente basado en imágenes para aumentar la diversidad taxonómica de la culturómica en comparación con un método de selección aleatoria. Demostramos la utilidad de este sistema mediante la generación anaeróbica de biobancos de aislamientos personalizados para 20 participantes humanos, lo que produjo un total de 26 997 aislamientos con 1197 borradores de genomas de alta calidad, que abarcan 394 variantes de secuencia de amplicón (ASV) 16S. Usando la información genómica y morfológica emparejada para cada aislamiento, entrenamos un modelo ML que puede predecir la identidad taxonómica basándose solo en la morfología de la colonia. La aplicación de este modelo ML condujo a una mejora en el aislamiento dirigido de microbios de interés. El análisis de imágenes a gran escala de todas las colonias cultivadas en placas de agar reveló interesantes patrones de crecimiento específicos de especies e interacciones entre especies. El análisis del genoma completo de biobancos personalizados descubrió la variación del nivel de cepa específica de la persona y las firmas de la transferencia horizontal de genes (HGT) dentro de los principales filos intestinales. Además, desarrollamos una base de datos web de acceso abierto (http://microbial-culturomics.com/) que contiene datos genotípicos, morfológicos y fenotípicos que se pueden buscar de todos los aislamientos generados por la culturómica automatizada como un recurso comunitario único y en expansión para el campo del microbioma.

La recolección de colonias es un método clásico de microbiología para el aislamiento clonal de cepas bacterianas. El crecimiento de colonias en las placas depende de muchos factores, incluida la composición del medio (por ejemplo, los nutrientes disponibles), las condiciones atmosféricas (por ejemplo, el nivel de oxigenación), la presencia de moléculas inhibidoras (por ejemplo, antibióticos), el pH, la humedad y los efectos de otros metabolitos difusibles derivados de colonias cercanas18,19,20. Se observan diferentes morfologías de colonias basadas en diferencias fisiológicas específicas de la cepa, influenciadas por la forma celular, la rigidez, la motilidad y la cinética de crecimiento, así como la producción de moléculas pigmentadas o matrices extracelulares y surfactantes9,10,11,12. Aunque estos rasgos de la colonia son fácilmente cuantificables, rara vez se documentan durante el aislamiento de la colonia. Como resultado, la recolección selectiva de colonias usando características visuales es generalmente cualitativa y no estandarizada, y los resultados pueden variar sustancialmente entre experimentos y experimentadores. Para abordar estas deficiencias, ideamos una plataforma denominada Culturomics by Automated Microbiome Imaging and Isolation (CAMII) para sistematizar la culturómica con datos morfológicos y genotípicos para el aislamiento de colonias y el análisis funcional.

La plataforma CAMII consta de cuatro elementos clave (Fig. 1a) discutidos a continuación: (1) un sistema de imágenes que recopila datos de morfología de colonias y un algoritmo de selección de colonias guiado por IA, (2) un robot de selección de colonias automatizado para alta aislamiento de rendimiento y disposición de aislamientos, (3) una tubería rentable para generar rápidamente datos genómicos para aislamientos seleccionados y (4) un biobanco de aislamiento físico y una base de datos digital con información de morfología, fenotipo y genotipo de colonias que permite realizar búsquedas. Por lo tanto, esta plataforma de culturómica integral puede producir colecciones aisladas de diversos microbiomas de entrada con un trabajo manual mínimo. Todo el sistema de generación de imágenes y aislamiento se construye con componentes listos para usar alojados en una cámara anaeróbica que proporciona control en tiempo real de la temperatura, la humedad y los niveles de oxígeno (Fig. 1b y Tabla complementaria 1). El robot CAMII tiene un rendimiento de aislamiento de 2000 colonias por hora y puede manejar 12 000 colonias por ejecución, que es una capacidad >20 veces mayor y más rápida que el aislamiento manual de colonias por parte de una persona. Para garantizar que nuestra capacidad de análisis genómico coincida con el rendimiento del aislamiento robótico, también desarrollamos un canal de secuenciación de bajo costo y alto rendimiento que aprovecha la automatización del manejo de líquidos para generar bibliotecas con códigos de barras para la secuenciación del ARNr 16S o la secuenciación del genoma completo (WGS; Métodos). El costo por aislado en esta tubería es de $0,45 para el aislamiento de colonias y la preparación de ADN genómico (ADNg), $0,46 para la secuenciación de ARNr 16S y $6,37 para WGS con una cobertura de >60x en una plataforma Illumina HiSeq, que es sustancialmente más económico que los servicios comerciales ( Tabla complementaria 2).

a, Marco de aislamiento de cepas basado en el fenotipo y la morfología y recopilación de datos del microbioma intestinal humano. Las muestras de heces humanas se sembraron en placas y se cultivaron bajo una selección de diferentes antibióticos y luego se aislaron colonias morfológicamente diversas, se almacenaron en biobancos y se analizaron mediante secuenciación posterior. b, Montaje del sistema automatizado de cultivo y aislamiento microbiano anaeróbico CAMII. c, Ilustración del aislamiento de colonias guiado por morfología en CAMII. Las colonias cultivadas en placas se toman imágenes bajo transiluminación y epiiluminación y se someten a segmentación de contorno y extracción de características morfológicas. Los datos son analizados por PCA para identificar el conjunto de colonias con mayor diversidad morfológica que luego son aisladas por un recolector de colonias integrado. d, Ilustración de diversas morfologías de colonias en placas. Las características de tamaño y forma de las colonias se extrajeron de imágenes transiluminadas, y las características de color de las colonias se extrajeron de imágenes epiiluminadas. e, la muestra fecal H1t1 se cultivó con siete antibióticos diferentes para evaluar su capacidad de producir las bacterias más singulares y diversas mediante el análisis 16S a nivel familiar. Se seleccionaron ciprofloxacina, trimetoprima y vancomicina para aislamientos de colonias posteriores. f, Número de ASV únicos obtenidos del aislamiento guiado por fenotipo en comparación con el aislamiento aleatorio de tres muestras fecales humanas H1t4, H5t1 y H6t1. El aislamiento fue realizado por CAMII; el aislamiento aleatorio se realizó en un subconjunto aleatorio de todas las colonias detectadas en las placas, y el aislamiento guiado por fenotipo se realizó en colonias seleccionadas por morfología mediante el algoritmo (Figura complementaria 1b). El valor de p se calcula mediante una prueba t pareada de dos colas sobre el área bajo la curva. Las cintas en las curvas representan las desviaciones estándar del número de ASV únicos obtenidos por el algoritmo.

Una característica única clave de la plataforma CAMII es el sistema de imágenes que recopila y aprende de los datos morfológicos de las colonias bacterianas (Fig. 1c). Específicamente, las imágenes transiluminadas, que muestran la altura, el radio y la circularidad de una colonia, y las imágenes epiiluminadas, que muestran el color y las características morfológicas complejas, como las arrugas, se capturan en CAMII para generar un conjunto de datos morfológicos multidimensionales y cuantificables. Desarrollamos una tubería de análisis de colonias personalizada que segmenta las colonias a lo largo de diversas características morfológicas (Métodos; Tabla complementaria 3 y Figura complementaria 1). El área, el perímetro y el radio medio reflejan el tamaño de la colonia, mientras que la circularidad, la convexidad y la inercia revelan la forma de la colonia. Las intensidades de los píxeles y sus variaciones en los canales rojo, verde y azul (RGB) resaltan las gradaciones de densidad y los colores en una colonia (Fig. 1d). A continuación, razonamos que las colonias morfológicamente distintas tienen más probabilidades de ser filogenéticamente diversas, lo que podría usarse para mejorar el aislamiento de colonias. Por lo tanto, desarrollamos una estrategia de "selección inteligente" guiada por imágenes para aislar aislamientos más diversos mediante la incorporación de colonias en un espacio euclidiano multidimensional basado en características capturadas y la selección de puntos de máxima distancia en este espacio que representan las colonias morfológicamente más distintas (Figura complementaria 1; Métodos). Para aumentar aún más la diversidad de bacterias que se pueden cultivar y examinar, CAMII también utiliza diferentes complementos antibióticos para enriquecer los subconjuntos de microbios más singulares y diversos1,13 (Fig. 2a,b complementaria). Por ejemplo, en una muestra de microbioma intestinal humano sano (H1t1), tres antibióticos (ciprofloxacina, Cip; trimetoprima, Tmp; vancomicina, Van) con diferentes mecanismos de acción provocaron los cultivos de enriquecimiento más distintos (Fig. 1e y Fig. 2c complementaria) .

Para evaluar sistemáticamente la capacidad y la fidelidad del aislamiento de colonias guiado por imágenes, aplicamos CAMII a muestras de microbioma intestinal de tres voluntarios humanos (H1t4, H5t1 y H6t1; Tabla complementaria 4). Los datos morfológicos de las colonias en placas se analizaron mediante análisis de componentes principales (PCA) para evaluar las características visuales más informativas (Fig. 1c y Fig. 1c complementaria; Métodos). Curiosamente, la densidad y el tamaño de las colonias fueron las firmas más dominantes (componentes principales 1 y 2, respectivamente) que en conjunto representaron el 72,0% de la variación morfológica (Fig. 3 complementaria). Luego usamos el robot CAMII para aislar 6144 colonias, aproximadamente la mitad de ellas fueron seleccionadas al azar de placas mGAM y la otra mitad usando nuestra estrategia de "selección inteligente" guiada por imágenes y selección de antibióticos. Los aislamientos se cultivaron en 384 pocillos y se sometieron a secuenciación de ARNr 16S para la identificación taxonómica. A continuación, las secuencias únicas de 16S V4 se agruparon en ASV (límite de identidad del 100 %) que proporcionan una identidad a nivel de especie aproximada21. Sorprendentemente, el aislamiento de colonias informado por datos fenotípicos produjo un conjunto de ASV sustancialmente más diverso que el aislamiento aleatorio para las tres muestras de microbioma (Fig. 1f). Por ejemplo, para obtener 30 ASV únicos, solo necesitamos aislar 85 ± 11 colonias utilizando nuestra estrategia selectiva de obtención de imágenes en comparación con las 410 ± 218 colonias que necesita la selección aleatoria. En particular, esta eficiencia de aislamiento mejorada se mantuvo durante la recolección, lo que implica que existe una ventaja sostenida en el uso de nuestra estrategia en un rango de profundidad de aislamiento deseada (Fig. 4a complementaria), y la colección de aislados generados representó mejor la diversidad microbiana de entrada subyacente y fue sustancialmente más incluso en composición medida por la equidad de Shannon (Figura complementaria 4b). El análisis filogenético de los aislados mostró que la selección de colonias optimizada con CAMII mejoró sustancialmente la diversidad de los microbios obtenidos (Fig. 5 complementaria). Esta ventaja es particularmente evidente dado que encontrar ASV únicos se vuelve asintóticamente más difícil con un número creciente de aislamientos. En conjunto, estos resultados demostraron que nuestro marco de aislamiento basado en datos guiado por IA en la plataforma CAMII puede aumentar sustancialmente la eficiencia de la culturómica y reducir el trabajo para aislar especies especialmente raras.

Si bien los microbiomas de diferentes personas pueden compartir conjuntos similares de especies bacterianas, las cepas que pertenecen a estas especies son muy exclusivas del individuo y pueden co-colonizar al mismo huésped durante muchos años22,23. Buscamos mostrar la utilidad de CAMII para generar colecciones de aislamiento intestinal personalizadas para 20 personas sanas (Tabla complementaria 4 y Figura complementaria 6a, b). Se analizó visualmente un total de 102 071 colonias y se seleccionaron e identificaron taxonómicamente 26 997 colonias mediante la secuenciación del ARNr 16S (Fig. 2a), lo que produjo 394 ASV únicos que cubren una amplia diversidad de microbiomas intestinales comensales sanos (Fig. 2b, c y Tabla complementaria 5 ).

a, Estadísticas de 20 biobancos de aislados intestinales personalizados. b, árbol filogenético de 394 ASV cubiertos por 26 997 microbiomas intestinales aislados en este estudio. El árbol de unión de vecinos de la filogenia se construyó en base a las secuencias 16S V4. El color de las ramas distingue el filo bacteriano y el círculo exterior muestra la prevalencia de ASV aislados en los 20 biobancos. c, Número de aislamientos para la taxonomía a nivel de familia de los 20 principales. d, Abundancia relativa acumulada de los ASV representados por aislamientos de biobancos personalizados en muestras fecales originales. Las barras muestran aislamientos de cualquier individuo en toda la colección y las líneas rojas muestran aislamientos derivados de la misma persona. e, mapas de calor para la abundancia relativa de ASV abundantes en muestras fecales originales y presencia o ausencia en los biobancos. Se muestran los ASV con una abundancia relativa promedio > 0,1 % y la barra lateral de la izquierda representa su taxonomía a nivel de familia. Los ASV encontrados en biobancos personalizados se muestran como barras negras en el mapa de calor derecho y los ASV no cultivados que no se encuentran en ningún biobanco están resaltados. f, Correlación de la abundancia relativa promedio en la muestra original de heces y el número de aislamientos en toda la colección para ASV. Se destacan los ASV muy abundantes que son difíciles de cultivar, es decir, con menos aislamientos. g, Abundancia relativa promedio de los ASV más abundantes pero con no más de 2 aislamientos en toda la colección. El color de las barras representa la taxonomía a nivel de familia.

Para evaluar la exhaustividad de esta colección de aislamientos, calculamos la abundancia de ASV aislados en las muestras fecales correspondientes mediante secuenciación de ARNr 16S a granel (Fig. 2d). Sorprendentemente, para cada individuo, el 80,9 ± 9,4% de los ASV por abundancia están representados al menos una vez en toda la colección de aislados. Los aislamientos derivados de cada persona constituyeron en promedio 45,6 ± 21,6% de la abundancia total de ASV bacteriano dentro de ese individuo (Fig. 2d). Además, la comparación de colecciones aisladas y muestras de heces a granel mostró que la mayoría de los ASV muy abundantes y prevalentes se aíslan al menos una vez en la colección (Fig. 6c-e complementaria). Además, cada colección aislada personalizada imita la muestra de heces a granel con perfiles de microbioma comparables y el índice de diversidad de Shannon (Figura complementaria 6f, g).

En total, demostramos el uso de CAMII para construir una colección profunda de aislamientos intestinales humanos que contiene 26 997 aislamientos que abarcan 394 ASV, con un rico conjunto de datos morfológicos, fenotípicos, taxonómicos y WGS vinculados. Para aumentar su utilidad para la comunidad de investigación, desarrollamos aún más un recurso en línea de búsqueda (http://microbial-culturomics.com) para albergar todos los datos del biobanco habilitados para CAMII, incluidos genomas, fenotipos e imágenes. Prevemos que este portal facilitará más análisis de genotipo a fenotipo y conducirá a más colecciones aisladas compartidas de otros entornos.

Estudios previos han observado que muchos microbios de diferentes ambientes son difíciles de cultivar en el laboratorio24,25. Por lo tanto, aprovechamos nuestros biobancos aislados generados sistemáticamente para evaluar la capacidad de cultivo del microbioma intestinal humano e identificar ASV bacterianos que siguen siendo recalcitrantes al aislamiento en nuestro entorno experimental. En las 20 colecciones de aislados personalizados, determinamos si se encuentran abundantes ASV en la materia fecal a granel (abundancia relativa promedio > 0,1 %) en el biobanco. En particular, una fracción sustancial de las bacterias intestinales no cultivadas pertenecía a las familias Ruminococcaceae y Lachnospiraceae (Fig. 2e y Tabla complementaria 6), que también se ha documentado previamente como 'no cultivable'24. Para cada ASV, comparamos la cantidad de aislamientos generados en nuestra colección total de aislamientos con su abundancia promedio en las heces a granel (Fig. 2f), que parecía estar positivamente correlacionada. Aún así, identificamos un conjunto de bacterias abundantes pero difíciles de cultivar, incluidas Faecalibacterium ASV-58, Prevatella ASV-470 y ASV-324, Oscillibacter ASV-215 y Clostridium XlVa ASV-287 (Fig. 2g). Curiosamente, Faecalibacterium ASV-58, del cual obtuvimos un aislado y realizamos WGS, coincidió con> 98% de identidad de nucleótidos promedio (ANI) en todo el genoma con el genoma ensamblado en metagenoma (MAG) de Candidatus cibiobacter qucibialis. Esta cepa de nuestra colección se informó anteriormente como la especie no cultivada más abundante en el intestino humano25 y está muy reducida en pacientes con enfermedad inflamatoria intestinal (EII), al igual que otras cepas de Faecalibacterium26.

Además, comparamos los aislamientos en nuestros biobancos con la base de datos existente1,3,22,25 de WGS e identificamos 11 especies adicionales que no habían sido cultivadas en ninguna colección de referencia (BIO-ML, CGR y HMP) pero que solo están asociadas con MAG en SGB. colección (Figura complementaria 7 y Tabla complementaria 7). Por ejemplo, además de Faecalibacterium ASV-58, aislamos otra especie abundante, Faecalibacterium sp. ASV-76 que representa >3 % de abundancia relativa en promedio en la materia fecal a granel, lo que amplía aún más la colección de microbiomas intestinales cultivables. Juntos, estos resultados resaltan los aislamientos cultivados y la diversidad faltante restante en función de nuestros medios y condiciones de crecimiento actuales, y ofrecen instrucciones para guiar los futuros esfuerzos de cultivo centrados en este microbioma intestinal de "materia oscura" (Tabla complementaria 6).

El cultivo enfocado de bacterias de interés a partir de una muestra de microbioma puede ser crucial para los estudios de mecanismos. Desafortunadamente, carecemos de la capacidad para cultivar selectivamente la mayoría de las especies bacterianas de una manera específica. En consecuencia, elegir una gran cantidad de colonias y confiar en la probabilidad estadística es la única solución práctica para obtener bacterias de interés. Esta estrategia, sin embargo, a menudo consume demasiados recursos, ya que puede requerir la recolección manual de miles de colonias. CAMII ofrece un método de selección de colonias automatizado y guiado por ML basado en la vinculación de la identidad taxonómica con la morfología de la colonia y, por lo tanto, en teoría, podría mejorar el aislamiento específico. Para probar esto, investigamos sistemáticamente nuestra colección de aislamientos del intestino profundo para analizar la relación entre los datos morfológicos y genotípicos. Curiosamente, las colonias de diferentes géneros exhibieron diversos patrones morfológicos (Fig. 3a, b). Por ejemplo, las colonias de Dorea, Bacteroides y Collinsella son generalmente grandes y densas, pero muestran diferentes circularidades (Collinsella > Bacteroides > Dorea), lo que refleja diferencias en sus características de crecimiento. Por otro lado, las colonias de Faecalibacterium son más pequeñas y más tenues, en consonancia con nuestros resultados anteriores de su mala capacidad de cultivo. Además, las morfologías de las colonias se agrupan significativamente según su filogenia (P = 0,008 según la prueba PERMANOVA en la Fig. 3c). Por ejemplo, la mayoría de los géneros de Clostridia están más cerca entre sí por ordenación basada en morfología (Fig. 3c). Por lo tanto, las morfologías de las colonias pueden incorporar una cantidad sustancial de información que podría vincularse con las identidades taxonómicas.

a, Mapa de calor de puntuaciones z promedio de características morfológicas en diferentes géneros bacterianos. Los diferentes géneros que exhiben diversos patrones morfológicos se clasificaron en diferentes grupos por agrupación jerárquica y el punto de color a la derecha representa su taxonomía a nivel de clase. b, Ejemplos de imágenes de colonias. Las imágenes transiluminadas están en el lado izquierdo y las imágenes epi-iluminadas están en el lado derecho. c, PCA ordenación de géneros en función de las características morfológicas de sus colonias. Los colores indican taxonomía a nivel de clase. d, Desempeño de la predicción del género bacteriano basado en características morfológicas por un clasificador de bosque aleatorio. Los números entre paréntesis representan el número de aislamientos para cada género. El entrenamiento y la evaluación del modelo se pusieron en marcha 20 veces y los diagramas de caja muestran la varianza del rendimiento (n = 20). La línea azul representa el rendimiento del modelo nulo. Definición de los elementos del diagrama de caja: línea central, mediana; límites de caja, cuartiles 25 superior e inferior; bigotes, rango intercuartílico 1,5×. e, Rendimiento del aislamiento dirigido basado en modelos. Las barras representan la media de la precisión de predicción de los modelos específicos individuales que se pusieron en marcha 20 veces y las barras de error representan las desviaciones estándar. Los valores de p se calcularon mediante la prueba t de Student de dos colas sobre las precisiones de n = 20 modelos inicializados aleatoriamente.

Evaluamos si la identidad taxonómica de las colonias podría predecirse de manera única incorporando solo su información morfológica en las placas. Entrenamos un modelo de clasificación aleatoria de bosques utilizando datos de morfología y taxonomía de subconjuntos de aislamientos seleccionados al azar (70% del total; Métodos). El rendimiento del modelo se evaluó en el 30% restante de los aislamientos. Sorprendentemente, nuestro modelo logró una precisión de ~70 % para la mayoría de los géneros que tenían más de 100 aislamientos en el conjunto de datos de entrenamiento (Fig. 3d). La tasa de recuerdo a nivel de género varió más ampliamente, destacando oportunidades abiertas para usar modelos más sofisticados para aprender características adicionales únicas de la colonia27,28,29. Algunos géneros, como Eggerthella, tenían una alta precisión y recordación, lo que indica que las morfologías de colonias únicas y altamente conservadas podrían aprovecharse específicamente para predicciones taxonómicas. Al analizar los aislamientos del mismo ASV, encontramos que la morfología de la colonia estaba muy conservada para los aislamientos dentro de la misma persona, pero era mucho más variable entre los aislamientos de diferentes personas (Fig. 8 complementaria). Dado que diferentes personas suelen portar distintas cepas de la misma especie, nuestros resultados sugirieron un alto grado de variación del nivel de cepa en la morfología de la colonia.

Para evaluar si las características de colonias informadas por IA pueden mejorar el aislamiento de microbios específicos, luego entrenamos modelos de bosque aleatorios en nuestro biobanco aisla datos de tres personas diferentes por separado (H12, H13 y H14). Los modelos se usaron para predecir colonias de Bifidobacterium, Parabacteroides y Eggerthella a partir de nuevas placas derivadas de las mismas muestras fecales, y luego se aislaron las colonias mediante CAMII y se secuenció el ARNr 16S para confirmar la identidad taxonómica (Métodos). En particular, la recolección guiada por morfología mejoró sustancialmente la eficiencia de aislamiento para estos géneros específicos hasta ocho veces en promedio (Fig. 3e), aumentando en gran medida la precisión de la recolección y mitigando la necesidad de examinar muchas colonias para encontrar los microbios deseados. Estos resultados enfatizan el valor de los conjuntos de datos de nuestro biobanco que vinculan el fenotipo con el genotipo y demuestran predicciones taxonómicas solo a partir de las características visuales de la colonia, lo que puede mejorar en gran medida el aislamiento microbiano específico.

Las colonias bacterianas pueden influir en el crecimiento de sus vecinas a través de interacciones entre especies, como la competencia por nutrientes o la alimentación cruzada de metabolitos esenciales. Estudios previos sugieren que las células vecinas pueden afectar críticamente el tamaño de las colonias de manera predecible19. Debido a que CAMII puede rastrear el crecimiento cinético de las colonias de forma continua, investigamos sistemáticamente las asociaciones de crecimiento conjunto entre los aislados intestinales en placas de agar. Una muestra fecal (H1t5; Tabla complementaria 4) se sembró en placas y se tomaron imágenes diariamente, y todas las colonias se aislaron posteriormente en el día 6 y sus identidades taxonómicas se determinaron con secuenciación 16S (Fig. 4a). Para cada ASV, el área acumulada de colonias en placas de agar se correlacionó con su abundancia en la muestra fecal original (Fig. 9 complementaria), lo que indica que nuestras condiciones in vitro generalmente fomentaron el crecimiento en el mismo grado que en el intestino. Curiosamente, las colonias pertenecientes al género Faecalibacterium exhibieron un crecimiento inicial más lento y solo comenzaron a emerger en presencia de otras colonias en crecimiento cercanas (Fig. 4b; Métodos). Esta observación sugiere que pueden existir interacciones comensales o mutualistas entre Faecalibacterium y otras especies.

a, Imágenes de una placa de ejemplo durante 6 días de crecimiento e identidades de colonias en la placa mediante secuenciación 16S. b, Proporción de colonias detectables en diferentes momentos en comparación con el día 6 para cada género. Los colores indican la taxonomía a nivel de familia. c, Correlación del tamaño de la colonia y el número de colonias cercanas para dos ASV representativos. En la Tabla complementaria 8 se proporciona una lista completa de correlaciones. Los valores de P se calculan mediante la prueba U de Mann-Whitney unilateral en el área de colonias con no más de una colonia cercana o no menos de cuatro colonias cercanas (n = 101 versus 82 para ASV-6 y 17 versus 9 para ASV-39). Definición de los elementos del diagrama de caja: línea central: mediana; límites de la caja: cuartiles 25 superior e inferior; bigotes: 1,5 × rango intercuartílico. d, Redes promotoras e inhibidoras del crecimiento por parejas entre géneros. Los efectos direccionales que promueven el crecimiento se muestran con flechas rojas afiladas y los efectos direccionales que inhiben el crecimiento se muestran con flechas azules romas. Los nodos representan géneros bacterianos y están coloreados por familia. Los tamaños de los nodos son proporcionales al número de aislamientos utilizados en este análisis y los anchos de los bordes son proporcionales a la importancia de las interacciones.

Para estudiar más sistemáticamente las interacciones de especies habilitadas por CAMII, analizamos la morfología de la colonia, la identidad taxonómica y los datos de vecindad de la colonia juntos. Agregamos datos de morfología y coordenadas físicas de 102 071 colonias capturadas visualmente (26 997 aisladas) y evaluamos si el crecimiento de una colonia se ve afectado por las células vecinas. Sorprendentemente, observamos una serie de patrones de crecimiento conjunto interesantes que pueden reflejar interacciones entre especies (Tabla complementaria 8). Por ejemplo, el tamaño de la colonia de Phocaeicola vulgatus ASV-6 se correlaciona negativamente con el número de células vecinas, lo que concuerda con un escenario de interacciones negativas generales mediadas por competencia o antagonismo entre P. vulgatus y otras bacterias en el intestino30 (Fig. 4c). Por otro lado, Faecalibacterium prausnitzii ASV-39, una de las especies asociadas con un crecimiento inicial más lento en la cinética de colonias (Fig. 4b), desarrolló colonias más grandes con más vecinos que reflejan una interacción positiva entre especies (Fig. 4c).

Luego incorporamos información taxonómica de colonias cercanas y observamos cómo el tamaño de la colonia de un género específico podría verse afectado por otros géneros. Brevemente, para cada par de géneros, comparamos los tamaños de las colonias de un género con el otro género presente en el vecindario y sin colonias presentes (Métodos). Sorprendentemente, identificamos aislamientos de dos géneros, Faecalibacterium y Clostridium IV, que crecen en tamaños más grandes cuando los aislamientos estaban cerca de Bifidobacterium, Phocaeicola y Bacteroides (Fig. 4d). Se ha informado que Faecalibacterium y Clostridium IV son las principales bacterias productoras de butirato en el intestino y podrían beneficiarse del crecimiento en cocultivo con especies de Bifidobacterium y Bacteroides31,32,33, lo cual es consistente con nuestros hallazgos. Por otro lado, observamos que los aislamientos de Phocaeicola son más pequeños con los aislamientos de Faecalibacterium como vecinos (Fig. 4d), lo que indica que la interacción de crecimiento conjunto podría ser beneficiosa solo para un lado. Además, de acuerdo con nuestro análisis de correlación anterior que examinó los números de aislados vecinos sin tener en cuenta la identidad de los vecinos, observamos que el crecimiento de Phocaeicola y Bacteroides podría ser inhibido por muchos otros géneros, lo que sugiere más investigaciones para comprender mejor el mecanismo subyacente de estos positivos. e interacciones negativas entre la microbiota intestinal. Juntos, nuestros resultados destacan que CAMII puede revelar patrones de crecimiento conjunto de colonias gobernados por interacciones entre especies, lo que puede ayudar a identificar microbios promotores del crecimiento y sus metabolitos difusibles que estimulan el crecimiento in vitro de especies exigentes.

Mapear la diversidad de bacterias intestinales a nivel de cepa en todo el genoma dentro de una persona es importante para comprender la dinámica de la colonización intestinal y los impulsores de la selección bacteriana y la adaptación específica para cada huésped humano1,2,34. Una ventaja clave del sistema CAMII es la capacidad de aislar y realizar WGS para una gran cantidad de aislamientos para ayudar a investigar las variaciones genómicas interpersonales e intrapersonales. Como tal, seleccionamos aislamientos que cubren los ASV más exclusivos y prevalentes de nuestro biobanco de microbiomas de 20 personas y realizamos WGS que produjo 1197 borradores de genomas de alta calidad (Figura 10 complementaria y Tabla complementaria 9). Los ensamblajes del genoma se analizaron más a fondo para determinar la taxonomía precisa a nivel de especie de los aislamientos (Métodos).

Primero exploramos las variaciones genómicas interpersonales a nivel de tensión en nuestra colección aislada (Métodos). De acuerdo con informes anteriores1,35, la mayoría de los aislamientos dentro de los mismos individuos tenían muy pocas variaciones genómicas (es decir, menos de 102 SNP), mientras que los aislamientos entre personas diferían en 103–105 SNP de todo el genoma (Fig. 5a). Curiosamente, se observó que algunos aislados filogenéticamente distintos (es decir, más de 104 SNP) de la misma especie coexistían dentro de la misma persona (Fig. 5a). Por ejemplo, se aislaron dos cepas distintas de P. vulgatus del individuo H4 y se encontraron dos cepas distintas de B. uniformis en el individuo H2 (Fig. 11 complementaria).

a, Número de SNP de todo el genoma entre aislamientos del mismo individuo o de individuos diferentes para 14 especies ricas en aislamientos. Los números después del nombre de la especie representan el número de pares interindividuales (rojo) e intraindividuales (azul). Definición de los elementos del diagrama de caja: línea central: mediana; límites de la caja: cuartiles 25 superior e inferior; bigotes: 1,5 × rango intercuartílico. b, Correlación entre el número de SNP en todo el genoma y la abundancia relativa en la muestra fecal original para especies ricas en aislamientos en H1 individual. El tamaño del punto representa el número de aislamientos utilizados en este análisis y el color representa la proporción de SNP presentes en un solo genotipo. c, Red de 2 kb + frecuencia HGT basada en 409 aislados de H1. Los nodos representan especies bacterianas y están coloreados por familia. Los tamaños de los nodos son proporcionales al número de aislamientos en la colección H1 y la opacidad de los bordes es proporcional a la frecuencia de HGT entre las dos especies conectadas. El color del borde representa diferentes tipos de HGT, es decir, interphyla, intraphyla e interfamily, o intrafamily HGT y el color del contorno del nódulo representa la tinción de Gram de las especies.

A continuación, buscamos evaluar la diversidad de niveles de cepa dentro de una sola persona mediante el análisis de 408 genomas aislados derivados del individuo H1 (Fig. 10 complementaria; Métodos). Debido a que se espera que las especies abundantes en el intestino sufran más divisiones celulares, planteamos la hipótesis de que pueden acumular más SNP en sus genomas, suponiendo aproximadamente la misma duración de la colonización intestinal. De hecho, la cantidad de SNP de todo el genoma dentro de cada taxón generalmente se correlaciona con su abundancia en el microbioma original (Fig. 5b). B. fragilis muestra una mayor proporción (56,0 %) de SNP foliares (es decir, presentes en un solo genotipo) mientras que otras especies muestran proporciones mucho más bajas, como P. goldsteinii (20,5 %), B. stercoris (22,4 %) y B. xylanisolvens (25,6%), lo que sugiere cuellos de botella poblacionales diferenciales y barridos selectivos a nivel de especie. A nivel de genes, también observamos evidencia de evolución adaptativa convergente. Por ejemplo, entre diferentes linajes aislados de P. dorei, identificamos dos variantes de codificación en el gen TodS (Fig. 12 complementaria), que codifica un sensor de quinasa de dos componentes que regula el metabolismo del tolueno en bacterias36. El tolueno y otros hidrocarburos aromáticos se encuentran en los alimentos y también se utilizan como materias primas industriales que podrían contaminar los alimentos y, por lo tanto, impulsar la evolución en el intestino37.

Otro impulsor importante de la evolución del microbioma intestinal dentro de la persona es HGT. En consecuencia, utilizamos todos los aislamientos H1 secuenciados del genoma completo para reconstruir una red HGT de elementos de ADN compartidos> 2 kb de longitud (Métodos). De acuerdo con informes recientes38,39, observamos que los eventos de HGT estaban fuertemente vinculados a la filogenia de los aislados, es decir, la mayoría de los eventos de HGT ocurrieron dentro de los mismos filos, pero también fueron bastante frecuentes en diferentes familias y entre distintas especies (Fig. 5c y Tabla complementaria 10). Curiosamente, observamos que las HGT se enriquecieron predominantemente entre aislamientos con la misma tinción de Gram, y las especies Gram negativas mostraron HGT más prevalentes que las especies Gram positivas (P = 0,0005 según la prueba de chi-cuadrado de Pearson). Este resultado es consistente con un hallazgo reciente39 y sugiere que diferentes estructuras de la pared celular pueden desempeñar un papel importante en las HGT. En particular, también se observaron HGT entre especies grampositivas y negativas en nuestro conjunto de datos, lo que inspiró estudios futuros para estudiar el efecto de las estructuras de la pared celular en las HGT y diseñar estos elementos HGT en una herramienta de edición de microbiomas. Luego, para examinar si estos HGT ocurrieron recientemente, calculamos la frecuencia media de HGT entre todos los pares de especies (Métodos). Presumimos que si los HGT ocurrieron recientemente entre dos especies, solo estarían asociados con una pequeña proporción de aislamientos, lo que resultaría en una baja frecuencia entre especies, mientras que si los HGT ocurrieran antes y proporcionaran beneficios de crecimiento, se enriquecerían y heredarían verticalmente por más tarde. generación, resultando en una alta frecuencia. Curiosamente, encontramos que la mayoría de los elementos HGT estaban presentes con frecuencia en los aislamientos (71,5 % HGT con una frecuencia >50 %), especialmente para los de las especies de Bacteroidaceae (Fig. 5c), lo que sugiere que ocurrieron en el pasado lejano y se enriquecieron bajo una fuerte selección dentro el ambiente intestinal.

Dada la alta prevalencia y frecuencia de HGT dentro del individuo, a continuación anotamos las secuencias de codificación de proteínas de los elementos HGT más extendidos para investigar sus funciones potenciales (Métodos). Curiosamente, identificamos múltiples genes de resistencia a los antibióticos (ARG) con diferentes mecanismos de acción, así como genes del sistema de secreción (Fig. 13 complementaria). Por ejemplo, las cuatro secuencias HGT más extendidas se encuentran sorprendentemente en al menos 13 especies diferentes de Bacteroidaceae, Porphyromonadaceae, Odoribacteraceae y Rikenellaceae y contenían múltiples ARG, incluidos protectores ribosómicos y bombas de eflujo de antibióticos, así como sistemas de secreción tipo III y tipo IV. . Si bien los ARG y los sistemas de secreción compartidos a través de HGT pueden conferir claras ventajas evolutivas40,41, hubo numerosos elementos generalizados en diferentes especies con genes de función desconocida (Fig. 13 complementaria), lo que sugiere mecanismos inexplorados que impulsan su persistencia a largo plazo en el intestino . En conjunto, estos resultados resaltan que los aislamientos dentro y entre las personas tienen una diversidad genómica que se puede caracterizar sistemáticamente mediante biobancos de cepas profundas habilitados por CAMII y análisis genómico para estudiar la colonización, la adaptación y la ecología del microbioma intestinal específico de la persona.

Históricamente, el aislamiento de cepas del microbioma intestinal se ha realizado de manera ad hoc, donde las características fenotípicas importantes se capturan de manera inadecuada y se documentan de manera deficiente junto con los datos genómicos. Aquí describimos la plataforma CAMII para industrializar la generación de biobancos aislados aprovechando la automatización, la visión artificial, el aprendizaje supervisado y la genómica. Cuando se combina con el 16S de bajo costo y la secuenciación del genoma completo, los datos fenotípicos y genómicos generados sistemáticamente a partir de la tubería forman un recurso valioso para estudiar la morfología, la diversidad y la evolución de las colonias microbianas. Usando el microbioma intestinal como un ejemplo de exhibición, el aislamiento habilitado por CAMII produjo extensos biobancos aislados de 20 individuos sanos que en conjunto cubrían >80 % de toda la microbiota por abundancia presente. Esta colección de aislamientos cubre la mayoría de la diversidad microbiana en el intestino sano y es uno de los biobancos de aislamientos personalizados más extensos descritos hasta la fecha. Con este recurso, demostramos que el análisis cuantitativo de las morfologías de las colonias puede predecir la taxonomía, mejorar el aislamiento de géneros objetivo y revelar interacciones potenciales entre microbios. El análisis sistemático de las diferencias genómicas entre aislamientos dentro y entre personas reveló patrones interesantes de selección de población, adaptación y HGT.

La mayoría de los datos presentados aquí se basaron en un medio rico en mGAM común para el aislamiento y la caracterización de cepas en el contexto del microbioma intestinal humano. La exploración de formulaciones de medios alternativos, otros micronutrientes y macronutrientes, y las perturbaciones bioquímicas asociadas con el medio ambiente o el huésped (por ejemplo, ácidos biliares y compuestos xenobióticos) podrían producir cambios morfológicos y de perfil de crecimiento que informan fisiologías y características inexploradas del microbioma intestinal. Las interacciones entre especies derivadas de los conjuntos de datos de CAMII podrían usarse más para mapear sistemáticamente los impulsores de la dinámica del microbioma. Prevemos que estas interacciones podrían facilitar el cultivo del microbioma recalcitrante de "materia oscura" al ayudar a identificar moléculas desconocidas derivadas de microbios que promueven el crecimiento cooperativo observado en este y otros estudios.

El sistema CAMII utiliza componentes estándar disponibles comercialmente y un código de fuente abierta que otros investigadores pueden replicar fácilmente (consulte la Tabla complementaria 1 para ver la lista de componentes). Prevemos que el portal en línea de búsqueda facilitará el intercambio de datos fenotípicos y genómicos estandarizados, que está a punto de crecer con el tiempo. El hardware CAMII podría expandirse aún más para integrar mediciones de espectrometría de masas para obtener perfiles característicos de colonias adicionales que pueden mejorar la identificación de especies y metabolitos. La microscopía automatizada a bordo podría introducir además flujos de datos ortogonales para visualizar células microbianas con una resolución micrométrica en diferentes canales espectrales. La visión artificial mejorada y los algoritmos de ML podrían generar predicciones de tensión aún mejores y mejorar el rendimiento del aislamiento.

Debido a que las cepas individuales son la unidad de acción dentro de una comunidad compleja, se necesitan colecciones de cepas más completas. Dichos biobancos completos se pueden utilizar para recrear un contexto más holístico que tenga en cuenta la composición, las interacciones entre especies y la capacidad metabólica de toda la comunidad, lo que mejorará los estudios de la función, la dinámica y la estabilidad del microbioma. Más allá del intestino humano, CAMII puede ser útil para otros microbiomas, como los del suelo, entornos acuáticos o agrícolas, incluido un mayor aislamiento y análisis de fagos, hongos y protozoos. El sistema de automatización robótica también puede ayudar a generar bibliotecas de cepas sistemáticas, como colecciones eliminatorias de inserción de transposones en matriz42 o bibliotecas de expresión genómica funcional43, así como mejorar la detección de chasis microbianos tratables para ingeniería genética44.

Este estudio fue aprobado y realizado bajo el protocolo AAAR0753 de la Junta de Revisión Institucional del Centro Médico de la Universidad de Columbia. Se obtuvo el consentimiento informado por escrito de los participantes en el estudio.

Se recolectaron muestras fecales frescas de 20 donantes humanos sanos y se procesaron dentro de las 3 h posteriores a la defecación. Brevemente, las heces se recolectaron utilizando el sistema de recolección de muestras Commode (Fisher, 02-544-208). Se usó una punta de pipeta estéril invertida de 200 µl (Rainin, RT-L200F) para extraer una pequeña muestra de la muestra de heces, que luego se colocó inmediatamente en un criovial estéril (Fisher, NC9347001). Las muestras fecales recolectadas luego se transfirieron a una cámara anaeróbica (Laboratorio Coy) y se homogeneizaron en 5 ml de PBS prerreducido mediante agitación vorticial completa. Las muestras homogeneizadas se pasaron más a través de un filtro de 40 µ (Fisher, 22363547) para eliminar los restos de la dieta, se dividieron en alícuotas en múltiples crioviales con glicerol (20 % de concentración final) y se transfirieron a un congelador de -80 °C para almacenamiento a largo plazo.

Toda la microbiota intestinal se cultivó en Gifu Anaerobic Medium Broth, Modified (mGAM; HyServe, 05433) en condiciones anaeróbicas (5 % H2, 10 % CO2 y 85 % N2) en una cámara anaeróbica. Brevemente, se prepararon placas de agar al 1,5 % (Thermo Fisher Scientific, 242811) con medio mGAM usando una bomba peristáltica (New Era Pump Systems NE-9000) y se etiquetaron con códigos de barras únicos. Para las placas suplementadas con ciprofloxacina (10 µg ml−1), trimetoprima (50 µg ml−1) o vancomicina (50 µg ml−1), se añadieron antibióticos durante la preparación de la placa. Luego, todas las placas se transfirieron a la cámara anaeróbica y se preredujeron durante ~ 24 h antes de colocarlas en placas. Las muestras fecales congeladas se descongelaron en la cámara anaeróbica y se diluyeron a 103 CFU por ml para cada condición de cultivo. Las diluciones óptimas se determinaron mediante experimentos de dilución en serie específicos de la muestra. A continuación, se dispensaron sobre la placa doscientos microlitros de muestras fecales diluidas y se esparcieron utilizando perlas de vidrio estériles. Las placas se sellaron en bolsas Ziploc para reducir la desecación y se incubaron a 37 °C durante 5 días de crecimiento de colonias.

La obtención de imágenes y el aislamiento de las cepas se realizó utilizando un sistema automatizado personalizado de obtención de imágenes y selección de colonias (CAMII). Después de 5 días de crecimiento, se tomaron imágenes de las placas de agar automáticamente en el sistema CAMII (Fig. 1c). Brevemente, las placas se colocaron primero en un apilador de carrusel. Una pinza de brazo robótico llevó las placas individuales a través de un escáner de código de barras a una plataforma de imágenes iluminada en el selector de colonias donde se tomaron imágenes en dos condiciones de iluminación (epi-iluminación y transiluminación) mediante el software de control Hudson RapidPick. Las etiquetas de las placas están vinculadas a las imágenes capturadas y el brazo robótico volvió a apilar automáticamente las placas con imágenes. Después de completar el proceso de obtención de imágenes, las placas se sellaron en bolsas Ziploc para evitar la desecación y se usó un script personalizado para segmentar diferentes colonias e identificar colonias morfológicamente únicas para su posterior recolección en función de las imágenes de la placa (Figura complementaria 1a). Las características morfológicas incluyen el área, el perímetro, el radio medio, la circularidad, la convexidad, la inercia y la media y las variaciones a lo largo del canal gris (imágenes transiluminadas) y los canales RGB (imágenes epiiluminadas). También se recopilan imágenes sin procesar de todas las colonias en la placa.

Para la selección aleatoria realizada en este estudio, se generó un subconjunto aleatorio de un número determinado de colonias a partir de todas las colonias detectadas por el script y se realizó el aislamiento automático en estas colonias. Para la recolección guiada por fenotipo, todas las colonias detectadas se sometieron primero a una selección optimizada en función de su morfología, y CAMII aisló un subconjunto de un número determinado de colonias con diversidad morfológica maximizada. El algoritmo detallado de la selección optimizada de colonias se puede encontrar en la figura complementaria 1b, y se puede acceder a los scripts utilizados para analizar imágenes de placas y morfologías de colonias en https://github.com/hym0405/CAMII.

Después de analizar las imágenes de las placas y generar una lista de colonias para seleccionar, se ejecutó un protocolo robótico similar para aislar estas colonias. En primer lugar, se volvieron a apilar las placas para recogerlas y se usó un dispensador de medios multicanal para dispensar 50 µl de medios líquidos mGAM en cada pocillo de dos placas ópticas de 384 pocillos estériles con código de barras (Thermo Fisher Scientific, 12-566-2; duplicado 'A' y 'B'), que luego se trasladaron al selector de colonias. A continuación, se transfirió una placa de agar al recogedor de colonias y las agujas esterilizadas por calor recogieron colonias individuales en las placas ópticas duplicadas. Las placas se cambiaron automáticamente cuando se recogieron todas las colonias seleccionadas (placa de agar) o se inocularon todos los pocillos (placa óptica). Después de recoger las colonias, las placas ópticas inoculadas se transfirieron a un sellador de placas (Brandel, 9795), se sellaron y se volvieron a apilar. Luego, las placas ópticas se incubaron a 37 ° C durante ~ 5 días para el cultivo de bacterias. Después del crecimiento bacteriano, las placas 'A' se sometieron a extracción de ADNg aguas abajo y se agregaron 30 µl de glicerol al 40 % a cada pocillo de las placas 'B', que se transfirieron a -80 °C para almacenamiento a largo plazo.

Para lograr la selección de colonias de guía morfológica, las características morfológicas de las colonias extraídas en el procesamiento de imágenes sin procesar se centralizaron y escalaron a la varianza de la unidad y luego se incrustaron mediante PCA. Se aplicó un algoritmo optimizado de selección de colonias a las características incrustadas para buscar un conjunto de colonias con la mayor diversidad morfológica (Fig. 1b complementaria).

Para evaluar cómo responden los diferentes ASV a las colonias cercanas (Fig. 4c), se calculó el número de colonias cercanas para los aislamientos en las placas, y el par de "colonias cercanas" se definió como dos colonias con una distancia entre sus coordenadas X-Y inferior a 30 píxeles más la suma de sus radios. Para evitar el impacto potencial de los antibióticos en la morfología de las colonias, para el análisis de la morfología solo se usaron colonias cultivadas en placas de mGAM únicamente.

Para evaluar cómo el crecimiento de un género específico podría verse afectado por otros géneros (Fig. 4d), primero identificamos pares de 'colonias cercanas' como se describió anteriormente, y el impacto del crecimiento del género-A en el género-B se cuantifica comparando el tamaño de las colonias del género-B con el género-A presente en la vecindad, es decir, como colonia cercana, a los tamaños de las colonias del género-B sin colonias cercanas: el tamaño del efecto se definió como el cambio en veces del tamaño promedio de la colonia con género-A presente al tamaño de colonia promedio sin colonias cercanas, y los valores de P se calcularon mediante la prueba U de Mann-Whitney sobre las distribuciones de tamaño entre el género-A presente en el vecindario y sin colonias cercanas, y la tasa de descubrimiento falso (FDR ) la corrección se realizó utilizando los métodos de Bonferroni-Holm. Para evitar el impacto potencial de los antibióticos en la morfología de las colonias, para el análisis de la morfología solo se usaron colonias cultivadas en placas de mGAM únicamente.

Para probar si la morfología de las colonias en las placas podría ayudar a predecir la identidad taxonómica, las colonias de géneros ricos en datos (>100 aislamientos en los 20 individuos) se sometieron a entrenamiento y pruebas modelo. Teniendo en cuenta el impacto potencial de la perturbación de los antibióticos y las colonias vecinas, se entrenó un modelo de bosque aleatorio multimarca en el 70 % de los aislamientos, que se muestrearon aleatoriamente utilizando las características morfológicas de 14 colonias, la condición de los antibióticos y la cantidad de colonias cercanas, y el rendimiento (precisión y recuperación) del modelo se evaluó en el 30% restante de los aislamientos. El procedimiento de entrenamiento y evaluación del modelo se reinició 20 veces con diferentes configuraciones de aleatorización para minimizar el sesgo, y el rendimiento de fondo del modelo se calculó mediante un modelo nulo (predicción basada en el número de aislamientos). Para realizar el aislamiento microbiano dirigido, se entrenó un modelo de bosque aleatorio multimarca en colonias de género rico en datos (>15 aislamientos del mismo individuo) de los individuos H12, H13 y H14 por separado, como se describe anteriormente. Luego se sembraron las mismas muestras fecales y se aplicó el modelo a las nuevas placas después del crecimiento bacteriano para examinar todas las colonias en las placas y predecir las colonias de la taxonomía específica a nivel de género. A continuación, todas las colonias de las placas se aislaron en CAMII y se sometieron a secuenciación 16S V4 para identificar su taxonomía y evaluar el rendimiento del aislamiento dirigido.

Para monitorear la cinética de crecimiento diariamente, la muestra fecal H1t5 se sembró en placas de solo mGAM y se tomaron imágenes de las placas todos los días durante 6 días de crecimiento. La detección y segmentación de colonias se realizaron en imágenes, y las características morfológicas de las colonias en diferentes días se compararon en función de sus coordenadas X-Y (Fig. 4a). A continuación, todas las colonias de las placas se aislaron en CAMII el día 6 y se sometieron a identificación taxonómica mediante secuenciación de ARNr 16S. Para cuantificar el crecimiento diferencial inicial de los géneros, el número de colonias detectables de cada género en cada día (seguido por las coordenadas x-y) se normalizó a su número total de colonias en el día 6 para calcular la proporción de colonias detectables (Fig. 4b) en cada día.

El gDNA de los aislamientos seleccionados se extrajo en un formato de 384 pocillos mediante un protocolo basado en el batido de perlas de sílice adaptado de un estudio anterior45. En primer lugar, se agregaron 40 µl de perlas de sílice de zirconio de 0,1 mm (Biospec, 11079101Z) y 120 µl de solución de lisis (Tris-HCl 50 mM, pH 7,5 y EDTA 0,2 mM) a cada pocillo de placas de pocillos profundos de 384 pocillos (Thermo Fisher Scientific , 07-202-505). A continuación, se añadieron 40 µl de soluciones de cultivo de aislados a cada pocillo y las placas se centrifugaron durante 1 min a 4500 gy se fijaron con una estera de sellado (Axygen, AM-384-DW-SQ). Para evitar el sobrecalentamiento durante el batido de las perlas, las placas se agitaron durante 5 s y se incubaron a -20 °C durante 10 min antes de batir. Luego, las placas se fijaron en un batidor de perlas (Biospec, 1001) y se sometieron a un batido de perlas durante 5 min, seguido de un período de enfriamiento de 10 min. El ciclo de batido de perlas se repitió una vez y las placas se centrifugaron a 4500 g durante 5 min para reducir los restos celulares. A continuación, se transfirieron 10 µl de lisado celular a una placa de PCR de 384 pocillos (Bio-Rad, HSP3801) y 2 µl de solución de proteinasa K (50 mM Tris-HCl, pH 7,5 y 1 µg µl−1 de proteinasa K (Lucigen, MPRK092) ) se añadió utilizando un Formulatrix Mantis. Finalmente, el lisado celular se sometió a digestión con proteinasa K en un termociclador (65 °C 30 min, 95 °C 30 min, 4 °C infinito) y se transfirió a -20 °C para almacenamiento a largo plazo. La extracción de gDNA para muestras de heces a granel se realizó utilizando el mismo protocolo con volúmenes de reacción aumentados en formato de 96 pocillos.

La secuenciación 16S de la región V4 para la identificación taxonómica de aislamientos se realizó en formato de 384 pocillos utilizando un conjunto de cebadores de secuenciación de indexación dual. En resumen, se diseñaron cebadores de amplicón 16S V4 con código de barras en base a cebadores 16S V4 universales y sintetizados por Integrated DNA Technologies. A continuación, se transfirió 1 µl de cada combinación única de cebador directo 16SV4f_5xx con código de barras y cebador inverso 16SV4r_7xx a una placa de PCR de 384 pocillos utilizando Labcyte Echo para fabricar placas de cebador de doble índice únicas. Luego, ~130 nl de gDNA se transfirieron a una placa de imprimación mediante un replicador de clavijas de 384 pocillos (Scinomix, SCI-6010.OS) y se agregaron 2 µl de mezcla maestra NEBNext Q5 PCR (NEB, M0543L) a cada pocillo usando Formulatrix Mantis . Luego, las muestras se sometieron a amplificación 16S V4 en un termociclador (98 °C 30 s, 40 ciclos: 98 °C 10 s, 55 °C 20 s, 65 °C 60 s; 65 °C 5 min; 4 °C infinito). Las bibliotecas de amplicones resultantes se agruparon manualmente y se sometieron a electroforesis en gel en geles de agarosa E-Gel EX, 2 % (Thermo Fisher Scientific, G402002). Las bandas de ADN esperadas (~390 pb) se extirparon del gel y se extrajeron con Wizard SV Gel and PCR Cleanup System (Promega, A9282) siguiendo las instrucciones del fabricante para eliminar los cebadores de PCR y los dímeros adaptadores. Las bibliotecas purificadas en gel se cuantificaron mediante el ensayo Qubit dsDNA HS (Thermo Fisher Scientific, Q32851) y se secuenciaron en la plataforma Illumina MiSeq (kits de reactivos: v2 300 ciclos, modo de extremo emparejado) a una concentración de carga de 8 pM con un 20 % de adición de PhiX (Illumina, FC-110-3001) junto con cebadores de secuenciación personalizados añadidos al cartucho de reactivo Miseq (6 µl de stock de 100 µM; pocillo 12: 16SV4_read1, pocillo 13: 16SV4_index1, pocillo 14: 16SV4_read2) siguiendo las instrucciones del fabricante. Las secuencias de todos los cebadores utilizados en la preparación y secuenciación de bibliotecas se proporcionan en la Tabla complementaria 11. La secuenciación 16S V4 de las muestras a granel se realizó utilizando un protocolo similar con volúmenes de reacción ampliados en formato de 96 pocillos. Además, se añadió SYBR Green I (concentración final: 0,2×; Thermo Fisher Scientific, S7563) a la reacción de PCR y se realizó una amplificación cuantitativa de 16S V4 y se detuvo durante la fase exponencial (típicamente 13–17 ciclos) y se avanzó la reacción. hasta el último paso de extensión.

Las lecturas de secuenciación sin procesar del amplicón 16S V4 se analizaron mediante USEARCH v11.0.667 (ref. 46). Específicamente, las lecturas de extremos emparejados se fusionaron usando el modo '-fastq_mergepairs' con la configuración predeterminada. Luego, las lecturas combinadas se sometieron a un filtrado de calidad utilizando el modo '-fastq_filter' con la opción '-fastq_maxee 1.0 -fastq_minlen 240' para mantener solo las lecturas con menos de una base de error esperada y más de 240 pb. Las lecturas restantes se deduplicaron (-fastx_uniques) y se agruparon en ASV (-unoise3) con una identidad del 100 %, y luego se buscaron las lecturas combinadas contra las secuencias de ASV (-otutab) para generar una tabla de recuento de ASV. La taxonomía de los ASV se asignó utilizando el clasificador Ribosomal Database Project v2.13 entrenado con el conjunto de entrenamiento 18 de ARNr 16S (ref. 47). La abundancia relativa de ASV en muestras a granel se define como el recuento de lecturas de ASV normalizado por el número total de lecturas mapeadas.

Después del agrupamiento de ASV, se analizó la tabla de conteo de ASV para calcular las siguientes métricas para cada aislado: conteo total de lecturas, los ASV con el mayor conteo de lecturas y la pureza de ese ASV. Los aislamientos con lecturas insuficientes o pureza deficiente (recuentos de lecturas < 5 o pureza < 0,5) se filtraron y la taxonomía de los aislamientos restantes se definió como los ASV con el mayor recuento de lecturas. Para construir la filogenia de los aislamientos, se realizó un alineamiento multisecuencial en las secuencias ASV de los aislamientos utilizando MUSCLE v5 (ref. 48) y las secuencias ASV alineadas se analizaron posteriormente mediante MEGA v11.0.11 (ref. 49) para calcular el árbol de unión de vecinos con el configuración predeterminada para la reconstrucción de la filogenia.

El mismo gDNA utilizado para la secuenciación del amplicón 16S V4 se sometió a la secuenciación del genoma completo para los aislamientos. Las bibliotecas de extremos emparejados se construyeron siguiendo un protocolo publicado de preparación de bibliotecas Nextera de bajo volumen50 y se secuenciaron en la plataforma Illumina Nextseq 500/550 (2 × 75 pb) y la plataforma HiSeq (2 × 150 pb). Luego, las lecturas sin procesar fueron procesadas por Cutadapt v2.1 con los siguientes parámetros: '--minimum-length 25:25 -u 10 -u -5 -U 10 -U -5 -q 15 --max-n 0 --pair -filter=any' para eliminar bases de baja calidad y adaptadores Nextera. La cobertura fue de 1,42 ± 2,86 millones de lecturas emparejadas por aislamiento y SNPsaurus realizó la secuenciación de lectura larga de PacBio para algunos aislamientos para mejorar el rendimiento del ensamblaje del genoma de novo.

Las lecturas de Illumina pasan el filtrado de calidad y las lecturas largas de PacBio fueron ensambladas por Unicycler v0.4.4 (ref. 51) con la configuración predeterminada para generar borradores de genomas de aislados, y la calidad y la taxonomía a nivel de especie de los borradores de genomas fueron luego evaluados por QUAST v4.6.3 (ref. 52), CheckM v1.0.13 (ref. 53) y GTDB-Tk v0.2.2 (ref. 54). Entre los 3271 ensamblajes de aislamientos, 1197 se definieron como borradores de genomas de alta calidad (cobertura > 20x; N50 > 5000 pb; integridad > 80 %; contaminación < 5 %) y se usaron para la variación genómica posterior y el análisis HGT. Para identificar la variación genómica a nivel de cepa de los aislamientos de microbiota intestinal dentro y entre individuos, se seleccionaron conjuntos preliminares con la mayor integridad y N50 de cada especie como genomas de referencia para la alineación de lecturas, y las lecturas procesadas de Illumina de los aislamientos se alinearon con los genomas de referencia de los misma especie por Bowtie2 v2.3.4 (ref. 55) en modo de extremo emparejado con configuración '--muy sensible'. Las alineaciones de lecturas resultantes luego fueron procesadas por SAMtools v1.9 y BCFtools v1.9 (ref. 56) con la configuración '--ploidy 1' para llamar a la variación genómica (SNP e Indels). Luego, las variaciones resultantes se sometieron a un filtrado de calidad para identificar genotipos "confiables" (cubiertos por ≥5 lecturas; con ≥0,9 haploidía) y solo se usaron variaciones de SNP con más del 90 % de genotipos "confiables" en todos los aislamientos para el análisis posterior. Para construir una filogenia basada en SNP, los perfiles básicos de los aislamientos en los sitios de SNP se concatenaron y luego MEGA v11.0.11 calculó el árbol UPGMA con la configuración predeterminada.

Para identificar especies aisladas en nuestro biobanco que no habían sido cultivadas previamente, FastANI v1.0 (ref. 57) calculó la identidad de nucleótidos promedio entre los borradores de genomas obtenidos en este estudio y MAG o genomas aislados de bases de datos disponibles públicamente, y los genomas con Se consideró que >95% ANI eran de la misma especie.

Para identificar HGT que ocurre entre especies dentro de aislamientos H1, comparamos todos los pares de genomas de diferentes especies por BLASTN v2.7.1 (ref. 58) con la configuración '-evalue 0.1 -perc_identity 99' para examinar sistemáticamente bloques de regiones genómicas con identidad de secuencia alta. Luego, se calculó el valor P de los HGT candidatos en función del ANI de todo el genoma entre los aislados y se ajustó aún más mediante el procedimiento de Benjamini-Hochberg. Los impactos explosivos con un valor de P ajustado <1 × 10−5 y de más de 2000 pb de longitud se consideraron eventos de HGT entre aislamientos de diferentes especies. La frecuencia de HGT entre especies se cuantificó mediante un método publicado previamente39,59, definido como el número de pares de genomas entre especies que comparten al menos un HGT dividido por el número total de pares de genomas entre especies. Para anotar los ARG y los sistemas de secreción en los elementos HGT, Prokka v1.12 (ref. 60) anotó las secuencias de los elementos HGT en modo metagenoma y BLASTP v2.7.1 buscó los CDS resultantes en la base de datos CARD v3.1.4 (ref. 61). para identificar aciertos ARG con valor e <1 × 10−5, identidad >20 y cobertura de consulta >50. Los sistemas de secreción también se predijeron en CDS de elementos HGT por parte de EffectiveDB62 con la configuración predeterminada.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Los datos de secuenciación generados en este estudio se enviaron a la base de datos NCBI BioProject (http://www.ncbi.nlm.nih.gov/bioproject/) con el número de acceso PRJNA745993 (ref. 63). Se puede acceder a otros datos asociados de la colección aislada, incluidas características morfológicas e imágenes sin procesar, en http://microbial-culturomics.com. La taxonomía de los ASV se asignó en función del conjunto de entrenamiento 18 de ARNr 16S proporcionado por Ribosomal Database Project. La anotación de los genes ARG y los sistemas de secreción en los elementos HGT se basó en la base de datos CARD v3.1.4 y la base de datos EffectDB, respectivamente.

Se puede acceder a los scripts utilizados para analizar imágenes de placas en este estudio en https://github.com/hym0405/CAMII ref. 64.

Poyet, M. et al. Una biblioteca de aislados bacterianos del intestino humano junto con datos multiómicos longitudinales permite la investigación del microbioma mecanicista. Nat. Medicina. 25, 1442–1452 (2019).

Artículo CAS PubMed Google Académico

Zhao, SJ et al. Evolución adaptativa dentro de los microbiomas intestinales de personas sanas. Microbio huésped celular 25, 656 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Zou, YQ et al. 1520 genomas de referencia de bacterias intestinales humanas cultivadas permiten análisis de microbiomas funcionales. Nat. Biotecnología. 37, 179 (2019)

Artículo CAS PubMed PubMed Central Google Scholar

Browne, HP et al. El cultivo de microbiota humana 'no cultivable' revela nuevos taxones y una extensa esporulación. Naturaleza 533, 543 (2016)

Artículo CAS PubMed PubMed Central Google Scholar

Goodman, AL et al. Amplias colecciones personales de cultivo de microbiota intestinal humana caracterizadas y manipuladas en ratones gnotobióticos. proc. Academia Nacional. ciencia EE. UU. 108, 6252–6257 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Villa, MM et al. Variación interindividual en el metabolismo de los carbohidratos de la dieta por bacterias intestinales revelada con cultivo microfluídico de gotitas. mSystems 5, e00864-19 (2020).

Artículo PubMed PubMed Central Google Académico

Watterson, WJ et al. Cultivo de alto rendimiento basado en gotas para la detección precisa de microbios intestinales resistentes a los antibióticos. eLife 9, e56998 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Ji, BW, Sheth, RU, Dixit, PD, Tchourine, K. y Vitkup, D. Dinámica macroecológica de la microbiota intestinal. Nat. Microbiol. 5, 768 (2020)

Artículo CAS PubMed Google Académico

Qamer, S., Sandoe, JAT & Kerr, KG Uso de la morfología de la colonia para distinguir diferentes cepas y especies de enterococos en cultivos mixtos a partir de muestras clínicas. J. Clin. Microbiol. 41, 2644–2646 (2003).

Artículo PubMed PubMed Central Google Académico

Allegrucci, M. & Sauer, K. Caracterización de variantes de morfología de colonias aisladas de biopelículas de Streptococcus pneumoniae. J. Bacteriol. 189, 2030-2038 (2007).

Artículo CAS PubMed Google Académico

Cabeen, MT, Leiman, SA y Losick, R. La detección de morfología de colonias descubre un papel para el sistema de fosfotransferasa relacionado con nitrógeno de Pseudomonas aeruginosa en la formación de biopelículas. mol. Microbiol. 99, 557–570 (2016).

Artículo CAS PubMed Google Académico

Martín-Rodríguez, AJ et al. Regulación de la morfología de colonias y formación de biopelículas en algas Shewanella. Microbio. Biotecnología. 14, 1183–1200 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Rettedal, EA, Gumpert, H. & Sommer, MOA El fenotipado multiplex basado en el cultivo de la microbiota intestinal humana permite la recuperación específica de bacterias no cultivadas previamente. Nat. común 5, 4714 (2014).

Artículo CAS PubMed Google Académico

Strittmatter, N. et al. Análisis de bacterias intactas mediante espectrometría de masas de ionización evaporativa rápida. química común 49, 6188–6190 (2013).

Artículo CAS Google Académico

Fang, JS & Dorrestein, PC Técnicas emergentes de espectrometría de masas para el análisis directo de colonias microbianas. actual Opinión Microbiol. 19, 120–129 (2014).

Artículo CAS PubMed Google Académico

Isozaki, A. et al. Una guía práctica para la clasificación celular inteligente activada por imágenes. Nat. Protocolo 14, 2370–2415 (2019).

Artículo CAS PubMed Google Académico

Hosny, A., Parmar, C., Quackenbush, J., Schwartz, LH & Aerts, HJWL Inteligencia artificial en radiología. Nat. Rev. Cáncer 18, 500–510 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Cole, JA, Kohler, L., Hedhli, J. y Luthey-Schulten, Z. Cooperación metabólica resuelta espacialmente dentro de colonias bacterianas densas. Sistema BMC. Biol. 9, 15 (2015).

Artículo PubMed PubMed Central Google Académico

Chacon, JM, Mobius, W. & Harcombe, WR La ​​base espacial y metabólica de la variación del tamaño de las colonias. ISME J. 12, 669–680 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Ratzke, C. & Gore, J. Modificar y reaccionar al pH ambiental puede impulsar interacciones bacterianas. PLoS Biol. 16, e2004248 (2018).

Artículo PubMed PubMed Central Google Académico

Edgar, RC Actualización del umbral de identidad del 97 % para OTU de ARN ribosómico 16S. Bioinformática 34, 2371–2375 (2018).

Artículo CAS PubMed Google Académico

Lloyd-Price, J. et al. Cepas, funciones y dinámicas en el Proyecto Microbioma Humano ampliado. Naturaleza 550, 61 (2017)

Artículo CAS PubMed PubMed Central Google Scholar

Lozupone, CA, Stombaugh, JI, Gordon, JI, Jansson, JK y Knight, R. Diversidad, estabilidad y resiliencia de la microbiota intestinal humana. Naturaleza 489, 220–230 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Almeida, A. et al. Un nuevo modelo genómico de la microbiota intestinal humana. Naturaleza 568, 499 (2019)

Artículo CAS PubMed PubMed Central Google Scholar

Pasolli, E. et al. Amplia diversidad de microbiomas humanos inexplorada revelada por más de 150 000 genomas de metagenomas que abarcan edad, geografía y estilo de vida. Celda 176, 649 (2019)

Artículo CAS PubMed PubMed Central Google Scholar

Franzosa, EA et al. Estructura del microbioma intestinal y actividad metabólica en la enfermedad inflamatoria intestinal. Nat. Microbiol. 4, 293–305 (2019).

Artículo CAS PubMed Google Académico

Huang, L. & Wu, T. Nueva aplicación de red neuronal para la clasificación de colonias bacterianas. teor. Biol. Medicina. Modelo. 15, 22 (2018).

Artículo PubMed PubMed Central Google Académico

Qu, KY, Guo, F., Liu, XR, Lin, Y. y Zou, Q. Aplicación del aprendizaje automático en microbiología. Frente. Microbiol. 10, 827 (2019).

Artículo PubMed PubMed Central Google Académico

Wang, HD et al. Detección temprana y clasificación de bacterias vivas utilizando imágenes coherentes de lapso de tiempo y aprendizaje profundo. Ciencia de la luz aplicación 9, 118 (2020).

Artículo PubMed PubMed Central Google Académico

Venturelli, OS et al. Descifrar las interacciones microbianas en comunidades de microbiomas intestinales humanos sintéticos. mol. sist. Biol. 14, e8157 (2018).

Artículo PubMed PubMed Central Google Académico

Kim, H., Jeong, Y., Kang, SN, You, HJ & Ji, GE El cocultivo con Bifidobacterium catenulatum mejora el crecimiento, la colonización intestinal y la producción de butirato de Faecalibacterium prausnitzii: estudios in vitro e in vivo. Microorganismos 8, 788 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Lindstad, LJ et al. El intestino humano Faecalibacterium prausnitzii despliega un sistema conservado altamente eficiente para la alimentación cruzada de oligosacáridos derivados de beta-manano. mBio 12, e0362820 (2021).

Artículo PubMed Google Académico

Louis, P., Young, P., Holtrop, G. & Flint, HJ Diversidad de bacterias productoras de butirato colónico humano revelada por análisis del gen butiril-CoA: acetato CoA-transferasa. Reinar. Microbiol. 12, 304–314 (2010).

Artículo CAS PubMed Google Académico

Tierney, BT et al. El panorama del contenido genético en el microbioma humano intestinal y oral. Microbio huésped celular 26, 283 (2019)

Artículo CAS PubMed PubMed Central Google Scholar

Chen, L. et al. La estabilidad genética a largo plazo y la especificidad individual del microbioma intestinal humano. Celda 184, 2302–2315 (2021).

Artículo CAS PubMed Google Académico

Lau, PCK et al. Una histidina quinasa de histidina de cremallera de leucina de región básica bacteriana que regula la degradación de tolueno. proc. Academia Nacional. ciencia Estados Unidos 94, 1453–1458 (1997).

Artículo CAS PubMed PubMed Central Google Scholar

Defois, C. et al. Los productos químicos alimentarios interrumpen la actividad de la microbiota intestinal humana e impactan en la homeostasis intestinal como lo revelan los sistemas in vitro. ciencia Rep. 8, 11006 (2018).

Artículo PubMed PubMed Central Google Académico

Jeong, H., Arif, B., Caetano-Anolles, G., Kim, KM & Nasir, A. Transferencia horizontal de genes en microorganismos asociados a humanos inferida por reconstrucción y reconciliación filogenética. ciencia Rep. 9, 5953 (2019).

Artículo PubMed PubMed Central Google Académico

Groussin, M. et al. Tasas elevadas de transferencia horizontal de genes en el microbioma humano industrializado. Celda 184, 2053 (2021)

Artículo CAS PubMed Google Académico

Juhas, M., Crook, DW & Hood, DW Sistemas de secreción tipo IV: herramientas de virulencia y transferencia génica horizontal bacteriana. Microbiol celular. 10, 2377–2386 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Woods, LC et al. La transferencia horizontal de genes potencia la adaptación al reducir las restricciones selectivas sobre la propagación de la variación genética. proc. Academia Nacional. ciencia EE. UU. 117, 26868–26875 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Goryshin, IY, Jendrisak, J., Hoffman, LM, Meis, R. & Reznikoff, WS Mutagénesis de transposones de inserción por electroporación de complejos de transposición de Tn5 liberados. Nat. Biotecnología. 18, 97–100 (2000).

Artículo CAS PubMed Google Académico

Mutalik, VK et al. Secuenciación de la biblioteca de expresión de escopeta con código de barras doble para la caracterización de alto rendimiento de rasgos funcionales en bacterias. Nat. común 10, 308 (2019).

Artículo PubMed PubMed Central Google Académico

Ronda, C., Chen, SP, Cabral, V., Yaung, SJ y Wang, HH Ingeniería metagenómica del microbioma intestinal de mamíferos in situ. Nat. Métodos 16, 167–170 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Ji, BW et al. Cuantificación de la variabilidad espaciotemporal y el ruido en las abundancias absolutas de microbiota mediante muestreo repetido. Nat. Métodos 16, 731–736 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Edgar, RC Buscar y agrupar órdenes de magnitud más rápido que BLAST. Bioinformática 26, 2460–2461 (2010).

Artículo CAS PubMed Google Académico

Wang, Q., Garrity, GM, Tiedje, JM & Cole, JR Clasificador bayesiano ingenuo para la asignación rápida de secuencias de ARNr en la nueva taxonomía bacteriana. aplicación Reinar. Microbiol. 73, 5261–5267 (2007).

Artículo CAS PubMed PubMed Central Google Scholar

Edgar, RC MUSCLE: alineación de secuencias múltiples con alta precisión y alto rendimiento. Ácidos Nucleicos Res. 32, 1792–1797 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Kumar, S., Stecher, G., Li, M., Knyaz, C. y Tamura, K. MEGA X: análisis de genética evolutiva molecular en plataformas informáticas. mol. Biol. Evol. 35, 1547-1549 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Baym, M. et al. Preparación económica de bibliotecas multiplexadas para genomas del tamaño de una megabase. PLoS ONE 10, e0128036 (2015).

Artículo PubMed PubMed Central Google Académico

Wick, RR, Judd, LM, Gorrie, CL y Holt, KE Unicycler: resolución de ensamblajes del genoma bacteriano a partir de lecturas de secuenciación cortas y largas. Cómputo PLoS. Biol. 13, e1005595 (2017).

Artículo PubMed PubMed Central Google Académico

Gurevich, A., Saveliev, V., Vyahhi, N. & Tesler, G. QUAST: herramienta de evaluación de calidad para ensamblajes de genomas. Bioinformática 29, 1072–1075 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM: evaluación de la calidad de los genomas microbianos recuperados de aislamientos, células individuales y metagenomas. Genoma Res. 25, 1043–1055 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk: un conjunto de herramientas para clasificar genomas con Genome Taxonomy Database. Bioinformática 36, ​​1925–1927 (2019).

PubMed PubMed Central Google Académico

Langmead, B. & Salzberg, SL Alineación rápida de lectura con intervalos con Bowtie 2. Nat. Métodos 9, 357–359 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. et al. El formato de mapa/alineación de secuencias y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Académico

Jain, C., Rodriguez, RL, Phillippy, AM, Konstantinidis, KT y Aluru, S. El análisis ANI de alto rendimiento de genomas procarióticos de 90K revela límites claros entre especies. Nat. común 9, 5114 (2018).

Artículo PubMed PubMed Central Google Académico

Camacho, C. et al. BLAST+: arquitectura y aplicaciones. BMC Bioinf. 10, 421 (2009).

Artículo Google Académico

Smillie, CS et al. La ecología impulsa una red global de intercambio de genes que conecta el microbioma humano. Naturaleza 480, 241–244 (2011).

Artículo CAS PubMed Google Académico

Seemann, T. Prokka: anotación rápida del genoma procariótico. Bioinformática 30, 2068–2069 (2014).

Artículo CAS PubMed Google Académico

Alcock, BP et al. CARD 2020: vigilancia del resistoma antibiótico con la base de datos integral de resistencia a los antibióticos. Ácidos Nucleicos Res. 48, D517–D525 (2020).

CAS PubMed Google Académico

Eichinger, V. et al. Actualizaciones de la base de datos eficaz y características novedosas para una mejor anotación de las proteínas secretadas por bacterias y los sistemas de secreción tipo III, IV y VI. Ácidos Nucleicos Res. 44, D669–D674 (2016).

Artículo CAS PubMed Google Académico

Huang, Y. et al. Culturómica microbiana de alto rendimiento mediante automatización y aprendizaje automático. WGS de recogida de aislamientos. Archivo de lectura de secuencias. https://www.ncbi.nlm.nih.gov/bioproject/PRJNA745993 (2023).

Huang, Y. et al. Culturómica microbiana de alto rendimiento mediante automatización y aprendizaje automático. GitHub. https://github.com/hym0405/CAMII (2023).

Descargar referencias

Damos las gracias a los miembros del laboratorio de Wang por sus consejos y comentarios sobre el manuscrito. HHW agradece el apoyo financiero relevante de NSF (MCB-2025515), NIH (1R01AI132403, 1R01DK118044 y 1R21AI146817), ONR (N00014-18-1-2237 y N00014-17-1-2353), Burroughs Wellcome Fund (1016691), Irma T. Hirschl Trust y Schaefer Research Award. RUS cuenta con el apoyo de una beca de la Fundación Fannie y John Hertz y una beca de investigación para graduados de la NSF (DGE-1644869). TM cuenta con el respaldo del Programa de capacitación de científicos médicos de los NIH (T32GM007367). MR y FV-C. cuentan con el apoyo de las becas de investigación para graduados de la NSF (DGE-1644869). CR cuenta con el apoyo de una beca Junior Fellows de la Simons Society of Fellows.

Estos autores contribuyeron igualmente: Yiming Huang, Ravi U. Sheth.

Departamento de Biología de Sistemas, Universidad de Columbia, Nueva York, NY, EE. UU.

Yiming Huang, Ravi U. Sheth, Shijie Zhao, Lucas A. Cohen, Kendall Dabaghi, Thomas Moody, Deirdre Ricaurte, Miles Richardson, Florence Velez-Cortes, Tomasz Blazejewski, Andrew Kaufman, Carlotta Ronda y Harris H. Wang

Departamento de Informática Biomédica, Universidad de Columbia, Nueva York, NY, EE. UU.

Yiwei sol

Departamento de Patología y Biología Celular, Universidad de Columbia, Nueva York, NY, EE. UU.

harris h wang

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

YH, RUS y HHW desarrollaron el concepto inicial; YH, KD y TB desarrollaron un software de selección de colonias basado en la morfología; YH, RUS y LAC realizaron experimentos y analizaron datos con aportes de HHW; TM, DR, YS, MR, FV-C., AK y CR ayudaron con el aislamiento de colonias; YS y SZ asistidos con aislamientos WGS; YH, RUS, SZ y HHW escribieron el manuscrito. Todos los demás autores discutieron los resultados y aprobaron el manuscrito.

Correspondencia a Harris H. Wang.

HHW es asesor científico de SNIPR Biome, Kingdom Supercultures, Fitbiomics, Arranta Bio, VecX Biomedicines, Genus PLC y cofundador científico de Aclid, ninguno de los cuales está involucrado en el estudio. RUS y KD son cofundadores de Kingdom Supercultures. Todos los demás autores declaran no tener intereses en competencia.

Nature Biotechnology agradece a Peter Turnbaugh y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Figs suplementarias. 1–13.

Tablas complementarias 1–11.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Huang, Y., Sheth, RU, Zhao, S. et al. Culturómica microbiana de alto rendimiento mediante automatización y aprendizaje automático. Nat Biotechnol (2023). https://doi.org/10.1038/s41587-023-01674-2

Descargar cita

Recibido: 12 agosto 2021

Aceptado: 11 de enero de 2023

Publicado: 20 febrero 2023

DOI: https://doi.org/10.1038/s41587-023-01674-2

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Microbiología de la naturaleza (2023)

Biotecnología de la Naturaleza (2023)