Nature Communications volume 14, numero articolo: 2676 (2023) Citare questo articolo
1390 accessi
4 Altmetrico
Dettagli sulle metriche
I virus negli ambienti costruiti (BE) sollevano preoccupazioni per la salute pubblica, ma sono generalmente meno studiati dei batteri. Per comprendere meglio le dinamiche virali negli BE, questo studio valuta i viroma di 11 habitat in quattro tipi di BE con un'occupazione da bassa ad alta. Si è scoperto che la diversità, la composizione, le funzioni metaboliche e gli stili di vita dei viroma dipendono dall'habitat. Le specie di Caudoviricetes sono ubiquitarie negli habitat superficiali delle BE e alcune di esse sono distinte da quelle presenti in altri ambienti. I geni della resistenza antimicrobica sono identificati nei virus che popolano le superfici frequentemente toccate dagli occupanti e nei virus che popolano la pelle degli occupanti. Diversi sistemi immunitari CRISPR/Cas e proteine anti-CRISPR si trovano rispettivamente negli ospiti batterici e nei virus, in linea con i collegamenti virus-ospite fortemente accoppiati. La prova di virus che potenzialmente aiutano l'adattamento dell'ospite in modo specifico all'habitat viene identificata attraverso un inserimento genetico unico. Questo lavoro illustra che le interazioni virus-ospite si verificano frequentemente nei BE e che i virus sono membri integrali dei microbiomi BE.
I virus meritano la nostra attenzione perché hanno impatti potenzialmente dannosi sulla salute umana1 ma svolgono anche un ruolo cruciale in molti ecosistemi2,3,4. Gli ambienti edificati (BE), dove le persone in genere trascorrono la maggior parte della loro vita, ospitano una ricca varietà di microrganismi5, ma la maggior parte degli studi sugli BE si sono concentrati in gran parte su batteri e funghi trascurando i virus6,7. Si stima che la concentrazione totale dei virus negli BE sia di circa 105 particelle/metro cubo8. Sebbene le condizioni ambientali della maggior parte degli BE siano oligotrofiche e considerate poco adatte alla vita microbica9, una cospicua diversità di virus, compresi i virus associati all'epidemia (ad esempio, SARS-CoV-210 e il virus della febbre gialla11), è stata riscontrata nelle comunità microbiche nell'aria e sulle superfici degli BE. Alcuni studi sui viroma negli edifici pubblici (ad esempio, asili nido e bagni) si sono concentrati principalmente su piccola scala spaziale e tipi di campioni limitati e non hanno studiato gli ospiti batterici dei virus12,13,14. Un recente studio su scala globale che ha applicato il sequenziamento metagenomico di massa senza arricchimento di virus ha fornito la prova che i virus sono onnipresenti sulle superfici pubbliche negli BE15.
Le interazioni virus-ospite sono fondamentali per l'ecologia e l'evoluzione dei microbiomi in diversi ecosistemi4,16,17. I recenti progressi negli strumenti bioinformatici hanno consentito una previsione accurata dell'associazione tra virus derivati dal metagenoma e i loro potenziali ospiti batterici, comprese le corrispondenze esatte di segnali molecolari (vale a dire brevi ripetizioni palindromiche regolarmente interspaziate clusterizzate [CRISPR] spaziatore, genoma integrato e tRNA) e risultati coerenti frequenza k-mer18. I fagi hanno sviluppato diversi stili di vita e strategie di trasmissione, come la commutazione del ciclo di vita temperato-litico, la trasduzione e la distruzione del gene dell'ospite, per sfruttare il meccanismo cellulare dell'ospite per la riproduzione19. Nella maggior parte degli ambienti marini e terrestri, i fagi sono spesso molto diversi e abbondanti, infettando quindi abitualmente una frazione significativa dei loro ospiti microbici che, insieme all'espressione dei geni metabolici ausiliari (AMG) codificati dal virus nei genomi dell'ospite, svolgono un ruolo chiave nel ciclo globale dei nutrienti4,20,21. Da un punto di vista ecologico, i fagi in una comunità microbica possono mediare la competizione tra specie batteriche stabilendo infezioni litiche attraverso diversi modelli ecologici consolidati, inclusi i modelli "kill-the-winner" e "piggyback-the-winner"22.
Mentre i fagi possono determinare rapidi cambiamenti genetici e fenotipici nei batteri, gli ospiti batterici possono anche facilmente sviluppare meccanismi di difesa per contrastare gli attacchi dei fagi attraverso la mutazione de novo e altri meccanismi molecolari23. Recentemente, vari sistemi funzionali CRISPR/associati a CRISPR (Cas) nei batteri sono stati identificati in uno studio metagenomico umano su tutto il corpo24. Tuttavia, per antagonizzare il sistema immunitario ospite, i fagi hanno sviluppato proteine anti-CRISPR (Acr) per inattivare le nucleasi Cas batteriche durante l’infezione25. L’inattivazione a lungo termine di CRISPR/Cas da parte dei fagi inibitori può portare alla perdita e persino all’assenza di CRISPR/Cas in alcuni lignaggi batterici26.
1 kb, as determined by Virsorter2 (Vs2) and DeepVirFinder (DVF) and assessed by CheckV. The number of contigs (n) is indicated. Boxplots represent the median, the first quartiles and third quartiles with whiskers drawn within the 1.5 interquartile range value. Points outside the whiskers are outliers. b Accumulation curves of the viral genomes in the combined, pier, public facility, residence, and subway datasets. c Metadata and taxonomy of 1174 viral genomes with >50% completeness. d Principal coordinate analysis of the Bray–Curtis dissimilarity matrix for all of the samples. The color and shape of the symbols indicate the built environments and surface materials, respectively./p> 0.85 (Fig. S2d), suggesting that no habitat had dominant vOTUs./p>50 genes mostly encoded proteins with functions in membrane transport (i.e., ABC transporter) and direct/indirect transcriptional regulation to control gene expression, genome replication, and transmission to other host cells (i.e., response regulator) (Fig. 3e). Other common viral functions, such as packaging, assembly, and lysis, were also found in the largest clusters (Fig. 3e)./p>50 genes. The protein-coding gene cluster that encodes beta-lactamase is highlighted in red. f The number of viral genes with putative beta-lactamase domains based on the Pfam and Kyoto Encyclopedia of Genes and Genomes (KEGG) databases. g The number of antimicrobial resistance genes (ARGs) encoding beta-lactamases based on the Resistance Gene Identifier (RGI) and Resfams databases. The Venn diagram summarizes the number of identified ARGs in the two databases, and the bar plot indicates the distribution of ARGs across BE habitats./p> 80) based on the AlphaFold2 tool. d Comparison of the high-confidence structures (plDDT > 80) of the four novel predicted Acr proteins with their closest reference./p> 80]) (Fig. S9). Comparison of the high-confidence structures of the four novel predicted Acr proteins with their closest references revealed differences, which may be responsible for the variations in their functions (Fig. 5d). Several predicted Acr proteins were located in complete circular vOTUs (with lysogenic and lytic cycles) of unknown families (Fig. S10a-b), suggesting that these proteins play roles in the evolution of poorly characterized Caudoviricetes viruses. Some Acr proteins were located between the integrase and terminase subunits in viruses with lysogenic cycles (Fig. S10a), while others were close to the terminase subunits in viruses that make lytic cycles (Fig. S10b), indicating that the Acr-encoding genes are expressed not only upon initial entry and during lysogeny but also upon transition to the lytic cycle to prevent the cleavage of progeny phage genomes by CRISPR/Cas systems, as previously demonstrated in Listeria phages50. Additionally, a set of lytic genes, including those encoding endolysins, the Rz lysis protein, holin, and holin–antiholin, were carried by specific complete circular vOTUs with lysogenic cycles (Fig. S10a). Conversely, one complete circular vOTU (SL336690_c_82__full) that makes lytic cycles still harbored an integrase (Fig. S10b), suggesting that this virus undergoes a transition from a lysogenic to a lytic cycle if the environmental condition changes51./p>90% completeness), and medium-quality (50–90% completeness) genomes were retained30 (Supplementary Data 2). For genomes that contained predicted proviruses, only the proviral regions were retained. PHASTER) (https://phaster.ca/)80 and VIBRANT (v.1.2.1)81 were separately applied to identify proviral sequences according to the following two criteria, as previously proposed21: (i) the viral contigs were from contigs with non-viral (host) flanking sequences or (ii) the viral contigs harbored lysogenic marker proteins (i.e., integrase and serine recombinase). In total, 332 unique proviruses were identified using the two aforementioned tools and CheckV, and only those (127) that were integrated into a bacterial genome had high confidence (the prophage region's total score was >90 in PHASTER) and were included in the downstream analysis./p>50% completeness were clustered into species-level vOTUs on the basis of 95% average nucleotide identity (ANI) of >85% alignment fraction relative to the shorter sequence based on centroid-based clustering30. Genus- and family-level vOTUs were generated using a combination of gene sharing and amino acid identity (AAI) based on Markov clustering82 as described previously30. Briefly, viral genomes with <20% AAI or <10% gene sharing and an inflation factor of 1.2 were clustered into family-level vOTUs, while those with <50% AAI or <20% gene sharing and an inflation factor of 2.0 were clustered into genus-level vOTUs./p>70% of the annotated proteins. At the family and genus ranks, a genome must have a minimum of two annotated proteins with >30% average AAI or three annotated proteins with >40% average AAI, respectively, aligned to a reference genome from the IMG/VR database30./p>5% amino acid representation in the total alignment length were retained. A concatenated protein phylogenetic tree was inferred from the multiple sequence alignment using FastTreeMP (v.2.1.11) with the auto model87. The tree was midpoint-rooted and visualized using iToL (v.6; https://itol.embl.de/)./p>60% to the reference sequences in the CARD database (v.3.0.9)90, and using the NCBI AMRFinderPlus (v.3.8.4) tool41, with the default options of 60% coverage and 80% identity, to the reference sequences in the Resfams database (v.1.2)40. The search was performed using the hmmsearch utility in the HMMER tool (v.3.1b2), with an E-value ≤ 1e−5 and a gathering threshold score ≥40. The Resfams annotation with the best score was adopted when an ARG received different annotations from the databases./p>1000 bp were binned into MAGs using MetaWRAP (v.1.2.1)78. The resulting MAGs were further refined using the "bin_refinement" function of MetaWRAP78 and dereplicated using the "dRep dereplicate" function of dRep (v.3.2.2)97. In total, 860 bacterial rMAGs with contamination ≤10% and completeness ≥50% were generated. The ORFs in the contigs of rMAGs were predicted using Prokka (v.1.14.6)98, and the functions were annotated using EggNOG-mapper (v.2.0.1)99./p>