2.4基因組重測序


2.4.1數(shù)據(jù)評估與指控


采用Illumina MiSeqTM分別得到的出發(fā)菌株W303-1A、F-2、A-2和B-2基因組序列圖像數(shù)據(jù),經(jīng)過CASAVA堿基識別(base calling)分析轉(zhuǎn)化為原始測序序列(raw reads)。由于測序得到的原始數(shù)據(jù)中含有帶接頭、低質(zhì)量的序列,為了保證信息分析質(zhì)量,使用Trimmomatic對原始數(shù)據(jù)進(jìn)行過濾,得到clean數(shù)據(jù)。如表1所示,出發(fā)菌株W303-1A、F-2、A-2和B-2檢測到的序列數(shù)分別為34 205 540、19 689 382、26 299 894和39 691 162 bp,經(jīng)過濾處理后,有效數(shù)據(jù)均超過了95.0%,且數(shù)據(jù)處理后,4株菌的重測序結(jié)果Q20、Q30都在95.0%以上,其中,G+C含量處于37.9%?39.7%,結(jié)果表明,測序結(jié)果有效,可用于進(jìn)一步的信息分析。

表1.重測序數(shù)據(jù)統(tǒng)計與評估


測序覆蓋度能夠間接反映變異檢測的完整性,因此,平均測序深度(depth)越大,后續(xù)能夠檢測到的變異位點則越多。如表1所示,出發(fā)菌株W303-1A、F-2、A-2和B-2全基因組的平均覆蓋深度分別為388.4×、229.3×、302.3×和448.6×,此外,4×、10×和20×的測序深度覆蓋率(coverage)均為99.0%以上,這一結(jié)果進(jìn)一步表明測序結(jié)果的準(zhǔn)確性和可靠性。


2.4.2變異監(jiān)測分析


如圖4所示,通過主成分分析(principal component analysis,PCA)對三重復(fù)和互反實驗中顯示一致結(jié)果的反應(yīng)微陣列數(shù)據(jù)點進(jìn)行分析。出發(fā)菌株W303-1A與經(jīng)馴化后菌株的差異基因分布在不同的區(qū)域,可以得出4種菌株的表達(dá)模式各不相同。其中,對羥基苯甲酸對第1個PC有正向影響,糠醛對第2個PC有負(fù)向影響。因此,A-2大致位于PC1的x軸位置。F-2位于左側(cè)的y軸位置,A-2位于右側(cè)象限。馴化后菌株對不同抑制環(huán)境的適應(yīng)性使得部分基因的表達(dá)模式發(fā)生不同變化,這可能是因為不同馴化菌株對抑制劑的反應(yīng)差異導(dǎo)致的。

圖4主成分分析


如表2所示,對4種菌株遺傳變異進(jìn)行分析發(fā)現(xiàn),大部分突變位點分布在基因的外顯子區(qū)(即CDS區(qū)域),而在UTR3以及剪切位點區(qū)域的突變數(shù)為0,這一結(jié)果表明經(jīng)過馴化后,突變基因多發(fā)生在編碼區(qū),這或許是由于非編碼區(qū)本身在整個基因組的比例較小。此外,與出發(fā)菌株W303-1A相比,F(xiàn)-2菌株具有3.7×104個SNP位點,其中在編碼區(qū)的突變點有3.1×104個,同義突變點有3 397個;A-2菌株具有3.7×104個SNP位點,其中在編碼區(qū)的突變點有3.1×104個,同義突變點有3 399個;B-2菌株具有3.7×104個SNP位點,其中在編碼區(qū)的突變點有3.1×104個,同義突變點有4 301個。Meriem等研究表明,當(dāng)基因突變位點位于編碼區(qū)時,突變增加了編碼蛋白序列差異的可能性,從而導(dǎo)致相應(yīng)基因功能的改變。

表2.SNP/Indel的注釋結(jié)果


2.4.3差異表達(dá)基因的功能和代謝通路富集分析


基于GO(gene ontology)數(shù)據(jù)庫對獲得的SNP位點和Indel位點進(jìn)行注釋,確定突變基因的功能及相關(guān)描述信息,以便更加精準(zhǔn)高效地找到目的基因。GO分析包括生物過程(biological process,BP)、細(xì)胞成分(cellular component,CC)和分子功能(molecular function,MF)。數(shù)據(jù)(false discovery rate,FDR<0.01)以條形圖表示(圖5A),其中,在生物過程類別下,大多數(shù)基因被注釋為代謝過程和細(xì)胞過程。在細(xì)胞成分方面,差異表達(dá)基因(DEGs)主要與細(xì)胞和細(xì)胞組分有關(guān),在分子功能類別上,大多數(shù)基因被注釋為催化活性。GO功能富集分析如圖5B?5D所示。其中,生物過程中含量最高是細(xì)胞缺氧反應(yīng)過程(GO:0071456),其次是細(xì)胞內(nèi)信號傳遞過程(GO:000494)和肌動球蛋白結(jié)構(gòu)組織的調(diào)控過程(GO:0034497)。細(xì)胞成分中,內(nèi)質(zhì)網(wǎng)(GO:0005783)和內(nèi)質(zhì)網(wǎng)膜(GO:0005789)的含量最高。在分子功能類別中,生物素羧化酶活性(GO:0004360)是最重要的,其次是谷氨酰胺果糖-6-磷酸轉(zhuǎn)氨酶活性(GO:0004075)和鋅離子結(jié)合能力(GO:0008270)。

圖5 GO功能注釋圖及富集分析。A:突變基因的GO分類;B:生物過程中突變基因的GO分類;C:細(xì)胞成分中突變基因的GO分類;D:分子功能中突變基因的GO分類析。色標(biāo)為富集分析校正P值。


KEGG通路數(shù)據(jù)庫是提供一個分子水平有關(guān)分子相互作用、反應(yīng)和關(guān)系網(wǎng)絡(luò)的生物系統(tǒng),KEGG通路對DEGs的分類主要分為5類:代謝、生物系統(tǒng)、環(huán)境信息處理、細(xì)胞過程和遺傳信息處理。一般來說大多數(shù)基因被注釋在代謝相關(guān)的途徑中,其中,代謝類別中,脂類代謝是第二類,其次是碳水化合物代謝和外源性生物降解代謝。在生物系統(tǒng)分類中,消化系統(tǒng)是最豐富的第二類。蛋白質(zhì)通常不是獨立行使其功能的,而是相互協(xié)調(diào)以完成一系列生化反應(yīng),因此,KEGG通路分析可以幫助揭示與疾病機制或藥物作用有關(guān)的細(xì)胞過程。以KEGG數(shù)據(jù)庫為參考,將158個差異基因連接到不同的路徑,其中ko 00360:苯丙氨酸代謝、ko 04728:多巴胺能突觸、ko 00983:藥物代謝和ko 04923:調(diào)節(jié)脂肪細(xì)胞的脂質(zhì)分解通路信號含量較高(圖6)。通過功能富集分析可以看出,馴化后的菌株發(fā)生了一系列突變,其中參與催化活性功能的相關(guān)酶基因和參與藥物代謝途徑的相關(guān)基因能與菌株的耐受性密切相關(guān),這些基因的功能注釋為進(jìn)一步明確馴化后菌株抗性機制提供重要素材??啡┖蛯αu基苯甲酸抑制了酵母的生長或?qū)е螺^長的滯后期,進(jìn)而降低了纖維素乙醇的產(chǎn)量和生產(chǎn)力。根據(jù)已公布的W303-1A基因組序列,對基因組進(jìn)行比對,排除匹配的遺傳物質(zhì)。根據(jù)SNP/Indel注釋和發(fā)酵參數(shù)的統(tǒng)計信息,找到了與糖代謝和抑制劑抗性相關(guān)的基因(表3和表4),幾種機制可以解釋呋喃對乙醇發(fā)酵的抑制作用。在酵母細(xì)胞中,葡萄糖首先經(jīng)過糖降解途徑轉(zhuǎn)換為丙酮酸,然后丙酮酸經(jīng)過丙酮酸脫羧酶和乙醇脫氫酶生成乙醇。高濃糠醛進(jìn)入細(xì)胞后,糠醛降解過程會與TCA循環(huán)、糖降解以及PPP等途徑競爭NADH和還原酶,進(jìn)而限制酵母菌生長和發(fā)酵效率。其中,在糠醛存在下生長的細(xì)胞粗提物中,與糖酵解相關(guān)的己糖激酶和甘油醛-3-磷酸脫氫酶的活性下降,使得乙醇脫氫酶中的NADH?和NADPH?進(jìn)行特異性還原HMF和糠醛而被消耗。此外,糠醛可以損傷DNA,阻礙RNA和蛋白質(zhì)的合成,降低酶活性,從而抑制細(xì)胞生長,同樣,釀酒酵母中的多種脫氫酶/還原酶能夠?qū)⒖啡┖虷MF還原為相應(yīng)的毒性較低的醇。此外,也有研究分析表明,在釀酒酵母中,糠醛會導(dǎo)致活性氧積累、液泡和線粒體膜損傷、染色質(zhì)和肌動蛋白損傷。通過重測序分析發(fā)現(xiàn),進(jìn)化菌株F-2/B-2中編碼乙醇脫氫酶(alcohol dehydrogenase,ADH)、果糖-1,6-二磷酸醛縮酶(fructose-1,6-diphosphate aldolase,FBA)和丙酮酸脫氫酶(pyruvate dehydrogenase,PDH)的基因發(fā)生部分突變,這些基因與酵母的糖代謝途徑相關(guān),而脫氧酶/還原酶基因的過表達(dá)增加了糠醛還原酶的活性,從而增加了酵母對抑制劑的耐受性。Liu等的研究表明,與野生型相比,過度表達(dá)醛還原酶基因的釀酒酵母NRRL Y-12632不僅對糠醛(20 mmol/L)和HMF(40 mmol/L)的耐受性更高,而且更容易恢復(fù),生長更佳。

圖6 KEGG通路突變基因的分類

表3.與糖代謝相關(guān)主要基因的注釋結(jié)果

表4.與抑制物抗性相關(guān)主要基因的注釋結(jié)果


酵母耐受對羥基苯甲酸的生理機制與維持細(xì)胞內(nèi)pH有關(guān),這是由質(zhì)子-ATP酶泵提供的,它以ATP為代價從細(xì)胞質(zhì)中去除質(zhì)子。在糖酵解過程中,己糖激酶、磷酸果糖激酶和烯醇酶在弱酸和呋喃衍生物存在下的抑制已經(jīng)被報道。對羥基苯甲酸在釀酒酵母中引起氧化應(yīng)激,抑制蛋白質(zhì)合成,損傷DNA,可能是釀酒酵母細(xì)胞生長受到抑制的原因,同時也會干擾胞內(nèi)TCA循環(huán)、糖降解以及PPP等途徑中酶的活性,影響菌株生長和代謝速率。通過重測序結(jié)果和相關(guān)基因的代謝通路相結(jié)合,將釀酒酵母中與抗抑制物相關(guān)的基因與已報道的相關(guān)基因進(jìn)行綜合分析與比較,初步確定了與抑制物相關(guān)的YAP1(參與氧化應(yīng)激反應(yīng)和氧化還原穩(wěn)態(tài)的轉(zhuǎn)錄激活劑)、PDR5(耐多種化學(xué)物質(zhì)的多效ABC外運載體)和RPN4(鋅指蛋白)基因產(chǎn)生部分突變或許是導(dǎo)致釀酒酵母中抑制因子耐受性的主要原因。


3結(jié)論


馴化策略對于構(gòu)建工業(yè)化纖維素乙醇發(fā)酵菌株十分有效。本研究通過逐漸提高壓力值-抑制物濃度的策略顯著提高了菌株的抑制物抗性,有效提高了乙醇生產(chǎn)效率。在糠醛和對羥基苯甲酸同時存在的情況下,進(jìn)化菌株的最終糖轉(zhuǎn)化率為98.4%。然而在實際預(yù)處理水解液中,抑制物的組成更為復(fù)雜多樣;并且在纖維素乙醇生產(chǎn)的發(fā)酵過程中,pH值、溫度以及五碳糖的利用都是影響發(fā)酵效率的重要因素。因此,提高菌株對多重脅迫的適應(yīng)性才能更大限度地提升生產(chǎn)效率。本研究還對出發(fā)菌株和馴化后菌株進(jìn)行了基因組重測序,結(jié)合參考文獻(xiàn)耐抑制物數(shù)據(jù)對變異點進(jìn)行分析挖掘,發(fā)現(xiàn)與抗抑制物有關(guān)的潛在突變位點,并對潛在基因進(jìn)行了分析,為后續(xù)菌株構(gòu)建提供更多可能的操作靶點。


作者貢獻(xiàn)聲明


樊美杉:研究構(gòu)思和設(shè)計、論文撰寫和修改;盧圣捷:數(shù)據(jù)收集和處理;張紅丹:協(xié)助實驗操作;鐘春梅:提供技術(shù)支持;謝君:研究構(gòu)思和設(shè)計。


相關(guān)新聞推薦

1、脂肽對蜜蜂球囊菌生長抑制作用及其孢子萌發(fā)的影響(三)

2、基于ELISA和細(xì)菌生長曲線應(yīng)用的結(jié)合定量檢測腸炎沙門氏菌(二)

3、?梅花鹿源A型產(chǎn)氣莢膜梭菌的分離鑒定、測序、毒素型、生化、耐藥性分析(三)

4、不同濃度條件下微藻計數(shù)方法:流式細(xì)胞儀VS血球計數(shù)板計數(shù)

5、絲狀真菌生長曲線測定方法及其測定裝置