【摘要】:在工業(yè)和醫(yī)學領域,細菌都是一種重要微生物,而研究其生長曲線特征對了解和利用微生物具有重要的指導意義。生長曲線的分析通常是利用數(shù)學模型來擬合細菌生長,估算出細菌的各種生長參數(shù),并以此研究微生物的生長規(guī)律。研究發(fā)現(xiàn),即使有些菌株的生長趨勢相似,不同的菌株間也存在著生長差異,因此在分析過程中需要改進已有的數(shù)學模型或者開發(fā)出新模型,進一步優(yōu)化分析方法,篩選并獲得有意義的生物學相關性的差異。


此外,由于近幾年人工智能的發(fā)展,使得機器學習算法被廣泛應用于科學研究的多個領域,特別是生物學范疇的多個研究方向。在此背景下,本文利用機器學習中的聚類分析算法,初步探究了作為模式微生物的大腸桿菌(Escherichia coli)及其基因組變異菌株在不同培養(yǎng)基條件下生長曲線聚類分析的可行性。首先,本文基于兩個變量,收集了一系列的生長曲線。變量一是菌株的基因組長度。本文選擇了基因組長度遞減的一系列的變異菌株,用來探究基因組變化對菌株生長模式的影響。變量二是培養(yǎng)菌株的培養(yǎng)基。


本文用三種不同成分的培養(yǎng)基,分析不同培養(yǎng)基對細菌生長模式的影響。然后本文通過Logistic模型分別擬合了每種培養(yǎng)基條件下不同長度基因組細菌的生長曲線,并分析模型擬合中得到的各參數(shù)的生物學意義。由于Logistic模型對大腸桿菌生長曲線衰亡期的擬合度程度不佳,為此本研究改進了Logistic模型。通過引入衰減率這一新參數(shù),使其更好了擬合了大腸桿菌實際的生長曲線。與原始Logistic模型相比,改進后的模型擬合生長曲線有更好的擬合優(yōu)度以及更低的殘差平方和。利用該改進后的Logistic模型分析基因組長度遞減的大腸桿菌生長曲線的數(shù)據(jù)發(fā)現(xiàn)了衰減率和大腸桿菌基因組長度之間具有負相關性。該發(fā)現(xiàn)對研究不同長度基因組細菌的生長模式提供了新模型擬合的方法論。


此外,為了驗證不依賴細菌生長模型的聚類分析的可行性,本研究首次對大腸桿菌生長曲線使用了時間序列聚類分析,并且使用動態(tài)時間規(guī)整算法(DTW)和導數(shù)動態(tài)時間規(guī)整算法(DDTW)計算大腸桿菌生長曲線之間的相似度。根據(jù)相似度執(zhí)行自下而上的層次聚類。在此基礎上,研究中綜合使用四種常用的聚類評價指標評價聚類結(jié)果來選擇出最優(yōu)的聚類結(jié)果。結(jié)果表明,培養(yǎng)基相同的生長曲線可以有效地劃分到相同的簇。另外,為了使聚類評價指標選擇的最優(yōu)聚類結(jié)果更加符合生長曲線的實際生物學特征,本研究中還提出一個新的評價標準。


根據(jù)這一新標準,獲得的聚類結(jié)果具有更高的準確性。生長曲線的合理聚類表明,DTW和DDTW結(jié)合層次聚類算法可用于大腸桿菌細菌生長分析。聚類結(jié)果表明,培養(yǎng)基確定了大腸桿菌的某些特定生長模式。與基因組相比,培養(yǎng)基對大腸桿菌生長曲線的影響具有更高的優(yōu)先級。本研究呈現(xiàn)了聚類方法用于細菌生長曲線聚類的可行性,為分析其他細菌生長曲線提供了技術(shù)參考。

相關新聞推薦

1、微生物生長曲線的監(jiān)測方法及步驟

2、藜麥和藍靛果酵母菌株篩選、培養(yǎng)、計數(shù)及混菌液態(tài)發(fā)酵工藝優(yōu)化(四)

3、基于可培養(yǎng)技術(shù)的古象牙病害微生物分離鑒定與抑菌劑篩選評價(三)

4、瑞香狼毒葉(斷腸草)對金黃色葡萄球菌和石膏樣毛癬菌生長曲線的影響——結(jié)果、討論

5、3種松乳菇菌絲體生長情況及生物學特性(一)