SboM-AG3 基因組的一般特征
基因組序列以單個(gè)重疊群形式獲得,代表了 19 倍覆蓋度的共識(shí)讀取?;蚪M大小約為 158,091 bp,G+C 含量為 50.4%;后者與其宿主細(xì)菌鮑氏志賀氏菌(51 mol%)幾乎相同。由于脈沖場(chǎng)凝膠電泳表明噬菌體基因組約為 165 kb,該噬菌體基因組是末端冗余的,具有 3.5 kb 的冗余區(qū)域。為了與沙門氏菌噬菌體 ViI 進(jìn)行比較,SboM-AG3 基因組在注釋前在 rIIA 同源物上游處打開。
開放閱讀框(ORFs)的鑒定和分析
序列中沒有通過 BLASTX 分析證明存在的移碼?;蚪M使用 AutoFACT 進(jìn)行自動(dòng)分析,輔以 tRNA 分析;并通過使用 Kodon 結(jié)合每個(gè)蛋白質(zhì)的 BLASTP、PFAM、TMHMM 和 Phobius 分析進(jìn)行手動(dòng)注釋。
基因組中共鑒定出 216 個(gè) ORFs(圖 3;附加文件 1,表 S1)。共有 146,356 個(gè)核苷酸(基因組的 92%)參與編碼推定蛋白質(zhì)。使用了四種不同的起始密碼子:ATG、GTG、CTG 和 TTG,頻率分別為 95.4%、3.2%、0.9% 和 0.5%。在 2009 年初首次注釋時(shí),只有 107 個(gè) ORFs 的產(chǎn)物與 NCBI 非冗余數(shù)據(jù)庫(kù)中的蛋白質(zhì)具有同源性。使用 CoreGenes 進(jìn)行的詳細(xì)比較蛋白質(zhì)組學(xué)分析顯示,該噬菌體與原綠球藻噬菌體 P-SSM2 共享 46 個(gè)同源物,與大腸桿菌噬菌體 T4 共享 57 個(gè),與氣單胞菌噬菌體 Aeh1 共享 60 個(gè),有趣的是,與德爾夫特菌噬菌體共享 69 個(gè)(該噬菌體基因組大小為 8,006 bp,G+C 含量為 42.9%),這表明 SboM-AG3 是有尾噬菌體目 T4 超家族的一個(gè)外圍成員。
最近的分析顯示,該噬菌體編碼的大多數(shù)蛋白質(zhì)(179 個(gè)或 82.8%)與沙門氏菌噬菌體 ViI 顯示序列相似性。另一個(gè)與 SboM-AG3 共享序列相似性的病毒是大腸桿菌 O157:H7 噬菌體 PhaxI,其在 GenBank 中由六個(gè)片段代表(HQ259285-HQ259290)。
密碼子使用和 tRNAs
發(fā)現(xiàn) ΦSboM-AG3 基因組包含四個(gè) tRNA 基因,對(duì)應(yīng)三種氨基酸,即絲氨酸(反密碼子:TGA 和 GCT)、天冬酰胺(GTT)和酪氨酸(GTA)。雖然描述沙門氏菌噬菌體 ViI 基因組的稿件表明存在五個(gè) tRNAs,但這些數(shù)據(jù)未包含在其 GenBank 提交中(FQ312032)。這兩種病毒共享 tRNA-Asn、tRNA-Tyr 和 tRNA-Ser(GCT),但不同之處在于 ViI 額外有兩個(gè) tRNA,分別是 Met(CAT) 和 Gln(TTG) 的 tRNA,而 SboM-AG3 擁有第二個(gè)絲氨酸-tRNA。在這兩種病毒中,tRNA 基因在基因組上的相對(duì)位置相同。SboM-AG3 tRNAs 的 GC 含量在 53.9% 到 56.2% 之間。將這些 tRNAs 添加到 ORFs 中,SboM-AG3 基因組的總編碼容量為 146,481 bp 或 92.7%。將噬菌體的密碼子使用模式與其宿主(鮑氏志賀氏菌)進(jìn)行比較表明,這些 tRNA 都不太可能增強(qiáng)翻譯。我們鑒定了六個(gè)在噬菌體基因中顯著過表達(dá)的密碼子(頻率≥30% 且增加≥1.5 倍)(苯丙氨酸[UUC]、異亮氨酸[AUG]、脯氨酸[CCU]、賴氨酸[AAG]、天冬氨酸[GAC] 和精氨酸[CGU]),然而噬菌體并未指定相應(yīng)的 tRNA。
在以下部分,我們將簡(jiǎn)要討論一些噬菌體編碼蛋白的作用。
核苷酸代謝、DNA 復(fù)制和重組
ΦSboM-AG3 基因組包含許多參與核苷酸代謝、DNA 復(fù)制和重組的基因。在前一類中,有 dNTP 二磷酸酶(orf063)、一個(gè)推定的煙酰胺磷酸核糖基轉(zhuǎn)移酶(orf149)、NrdA(orf093)、NrdB(orf090)和谷氧還蛋白(orf088)同源物,以及胸苷酸合成酶(orf066)。至少鑒定出九個(gè)基因在大腸桿菌噬菌體 T4 的 DNA 復(fù)制中發(fā)揮重要作用,包括 DNA 聚合酶(orf236)、引物酶(orf102)、三個(gè)被定義為具有解旋酶活性的蛋白質(zhì)(gp orf041/059/125)和 DNA 連接酶(orf045)。重組蛋白包括兩個(gè)拓?fù)洚悩?gòu)酶(orf014/017)、一個(gè) T4 gp46/47 重組酶對(duì)(orf119/121)和 UvsWXY 同源物(orf168/061/170)。
裂解
在基因組中未檢測(cè)到編碼溶菌酶或裂解酶的基因。Holin 通常是小蛋白質(zhì),其特征在于存在兩個(gè)或三個(gè)跨膜(TM)結(jié)構(gòu)域。這些標(biāo)準(zhǔn)排除了基因 9.1、78、117、244 或 246,它們分別具有 65、103、54、65 和 61 個(gè)氨基酸。由于 holin 基因通常在噬菌體基因組上相鄰排列,對(duì)基因 10、11、79、80、243 和 247 進(jìn)行的詳細(xì) PSI-BLAST 檢查未能揭示溶菌酶同源物或結(jié)構(gòu)域。
轉(zhuǎn)錄和調(diào)控序列
在沙門氏菌噬菌體 ViI 的基因組序列中未鑒定出任何轉(zhuǎn)錄調(diào)控位點(diǎn)?;谂c由 Sigma 70 識(shí)別的共識(shí)管家大腸桿菌啟動(dòng)子(TTGACA(N15-18)TATAAT)的序列同源性,初步鑒定了八個(gè)啟動(dòng)子(附加文件 2,表 S2),它們可能用于早期轉(zhuǎn)錄。
T4 相關(guān)噬菌體中晚期基因的轉(zhuǎn)錄起始涉及核心 RNA 聚合酶、噬菌體編碼的 sigma 因子(gp55)、一個(gè)輔助蛋白(gp33)和滑動(dòng)夾蛋白 gp45 之間的復(fù)合物,該復(fù)合物“促進(jìn)轉(zhuǎn)錄延伸”。這適用于 SboM-AG3 的產(chǎn)物。SboM-AG3 編碼所有三種蛋白質(zhì)的同源物:gp55(Orf122)、gp33(Orf076)和 gp45(Orf165)?;谕砥趩?dòng)子的序列(TATAAATA)并允許一個(gè)錯(cuò)配,在 SboM-AG3 的基因組中鑒定了 17 個(gè)推定的晚期啟動(dòng)子。在三種情況下,推定的啟動(dòng)子可能導(dǎo)致被推定為晚期產(chǎn)物的表達(dá):P orf072(T4 樣 gp2 DNA 末端保護(hù)蛋白上游)、P orf084(gp5 基板中心亞基)和 P orf217(gp6 基板楔形亞基)。構(gòu)建了一個(gè) WebLogo,從中得出的共識(shí)序列 TNT(N3)A(N10)C(N2)ATNAATA 被用于搜索基因組中其他潛在的晚期啟動(dòng)子,允許一個(gè)錯(cuò)配。鑒定出了三個(gè)。
發(fā)現(xiàn)了四十個(gè)基因間 ρ-非依賴性終止子,這種情況讓人聯(lián)想到大腸桿菌噬菌體 T1(附加文件 2,表 S2)。
相關(guān)新聞推薦
1、雨水長(zhǎng)期貯存環(huán)境下微生物生長(zhǎng)特征與影響因素研究
2、微生物領(lǐng)域數(shù)據(jù)庫(kù)及其分析系統(tǒng)建設(shè)研究取得進(jìn)展
3、基于自動(dòng)比濁儀度法對(duì)黃曲霉的初始生長(zhǎng)動(dòng)態(tài)的影響,快速篩選出抗真菌化合物
