2.4基因組重測(cè)序
2.4.1數(shù)據(jù)評(píng)估與指控
采用Illumina MiSeqTM分別得到的出發(fā)菌株W303-1A、F-2、A-2和B-2基因組序列圖像數(shù)據(jù),經(jīng)過(guò)CASAVA堿基識(shí)別(base calling)分析轉(zhuǎn)化為原始測(cè)序序列(raw reads)。由于測(cè)序得到的原始數(shù)據(jù)中含有帶接頭、低質(zhì)量的序列,為了保證信息分析質(zhì)量,使用Trimmomatic對(duì)原始數(shù)據(jù)進(jìn)行過(guò)濾,得到clean數(shù)據(jù)。如表1所示,出發(fā)菌株W303-1A、F-2、A-2和B-2檢測(cè)到的序列數(shù)分別為34 205 540、19 689 382、26 299 894和39 691 162 bp,經(jīng)過(guò)濾處理后,有效數(shù)據(jù)均超過(guò)了95.0%,且數(shù)據(jù)處理后,4株菌的重測(cè)序結(jié)果Q20、Q30都在95.0%以上,其中,G+C含量處于37.9%?39.7%,結(jié)果表明,測(cè)序結(jié)果有效,可用于進(jìn)一步的信息分析。
表1.重測(cè)序數(shù)據(jù)統(tǒng)計(jì)與評(píng)估
測(cè)序覆蓋度能夠間接反映變異檢測(cè)的完整性,因此,平均測(cè)序深度(depth)越大,后續(xù)能夠檢測(cè)到的變異位點(diǎn)則越多。如表1所示,出發(fā)菌株W303-1A、F-2、A-2和B-2全基因組的平均覆蓋深度分別為388.4×、229.3×、302.3×和448.6×,此外,4×、10×和20×的測(cè)序深度覆蓋率(coverage)均為99.0%以上,這一結(jié)果進(jìn)一步表明測(cè)序結(jié)果的準(zhǔn)確性和可靠性。
2.4.2變異監(jiān)測(cè)分析
如圖4所示,通過(guò)主成分分析(principal component analysis,PCA)對(duì)三重復(fù)和互反實(shí)驗(yàn)中顯示一致結(jié)果的反應(yīng)微陣列數(shù)據(jù)點(diǎn)進(jìn)行分析。出發(fā)菌株W303-1A與經(jīng)馴化后菌株的差異基因分布在不同的區(qū)域,可以得出4種菌株的表達(dá)模式各不相同。其中,對(duì)羥基苯甲酸對(duì)第1個(gè)PC有正向影響,糠醛對(duì)第2個(gè)PC有負(fù)向影響。因此,A-2大致位于PC1的x軸位置。F-2位于左側(cè)的y軸位置,A-2位于右側(cè)象限。馴化后菌株對(duì)不同抑制環(huán)境的適應(yīng)性使得部分基因的表達(dá)模式發(fā)生不同變化,這可能是因?yàn)椴煌Z化菌株對(duì)抑制劑的反應(yīng)差異導(dǎo)致的。
圖4主成分分析
如表2所示,對(duì)4種菌株遺傳變異進(jìn)行分析發(fā)現(xiàn),大部分突變位點(diǎn)分布在基因的外顯子區(qū)(即CDS區(qū)域),而在UTR3以及剪切位點(diǎn)區(qū)域的突變數(shù)為0,這一結(jié)果表明經(jīng)過(guò)馴化后,突變基因多發(fā)生在編碼區(qū),這或許是由于非編碼區(qū)本身在整個(gè)基因組的比例較小。此外,與出發(fā)菌株W303-1A相比,F(xiàn)-2菌株具有3.7×104個(gè)SNP位點(diǎn),其中在編碼區(qū)的突變點(diǎn)有3.1×104個(gè),同義突變點(diǎn)有3 397個(gè);A-2菌株具有3.7×104個(gè)SNP位點(diǎn),其中在編碼區(qū)的突變點(diǎn)有3.1×104個(gè),同義突變點(diǎn)有3 399個(gè);B-2菌株具有3.7×104個(gè)SNP位點(diǎn),其中在編碼區(qū)的突變點(diǎn)有3.1×104個(gè),同義突變點(diǎn)有4 301個(gè)。Meriem等研究表明,當(dāng)基因突變位點(diǎn)位于編碼區(qū)時(shí),突變?cè)黾恿司幋a蛋白序列差異的可能性,從而導(dǎo)致相應(yīng)基因功能的改變。
表2.SNP/Indel的注釋結(jié)果
2.4.3差異表達(dá)基因的功能和代謝通路富集分析
基于GO(gene ontology)數(shù)據(jù)庫(kù)對(duì)獲得的SNP位點(diǎn)和Indel位點(diǎn)進(jìn)行注釋?zhuān)_定突變基因的功能及相關(guān)描述信息,以便更加精準(zhǔn)高效地找到目的基因。GO分析包括生物過(guò)程(biological process,BP)、細(xì)胞成分(cellular component,CC)和分子功能(molecular function,MF)。數(shù)據(jù)(false discovery rate,FDR<0.01)以條形圖表示(圖5A),其中,在生物過(guò)程類(lèi)別下,大多數(shù)基因被注釋為代謝過(guò)程和細(xì)胞過(guò)程。在細(xì)胞成分方面,差異表達(dá)基因(DEGs)主要與細(xì)胞和細(xì)胞組分有關(guān),在分子功能類(lèi)別上,大多數(shù)基因被注釋為催化活性。GO功能富集分析如圖5B?5D所示。其中,生物過(guò)程中含量最高是細(xì)胞缺氧反應(yīng)過(guò)程(GO:0071456),其次是細(xì)胞內(nèi)信號(hào)傳遞過(guò)程(GO:000494)和肌動(dòng)球蛋白結(jié)構(gòu)組織的調(diào)控過(guò)程(GO:0034497)。細(xì)胞成分中,內(nèi)質(zhì)網(wǎng)(GO:0005783)和內(nèi)質(zhì)網(wǎng)膜(GO:0005789)的含量最高。在分子功能類(lèi)別中,生物素羧化酶活性(GO:0004360)是最重要的,其次是谷氨酰胺果糖-6-磷酸轉(zhuǎn)氨酶活性(GO:0004075)和鋅離子結(jié)合能力(GO:0008270)。
圖5 GO功能注釋圖及富集分析。A:突變基因的GO分類(lèi);B:生物過(guò)程中突變基因的GO分類(lèi);C:細(xì)胞成分中突變基因的GO分類(lèi);D:分子功能中突變基因的GO分類(lèi)析。色標(biāo)為富集分析校正P值。
KEGG通路數(shù)據(jù)庫(kù)是提供一個(gè)分子水平有關(guān)分子相互作用、反應(yīng)和關(guān)系網(wǎng)絡(luò)的生物系統(tǒng),KEGG通路對(duì)DEGs的分類(lèi)主要分為5類(lèi):代謝、生物系統(tǒng)、環(huán)境信息處理、細(xì)胞過(guò)程和遺傳信息處理。一般來(lái)說(shuō)大多數(shù)基因被注釋在代謝相關(guān)的途徑中,其中,代謝類(lèi)別中,脂類(lèi)代謝是第二類(lèi),其次是碳水化合物代謝和外源性生物降解代謝。在生物系統(tǒng)分類(lèi)中,消化系統(tǒng)是最豐富的第二類(lèi)。蛋白質(zhì)通常不是獨(dú)立行使其功能的,而是相互協(xié)調(diào)以完成一系列生化反應(yīng),因此,KEGG通路分析可以幫助揭示與疾病機(jī)制或藥物作用有關(guān)的細(xì)胞過(guò)程。以KEGG數(shù)據(jù)庫(kù)為參考,將158個(gè)差異基因連接到不同的路徑,其中ko 00360:苯丙氨酸代謝、ko 04728:多巴胺能突觸、ko 00983:藥物代謝和ko 04923:調(diào)節(jié)脂肪細(xì)胞的脂質(zhì)分解通路信號(hào)含量較高(圖6)。通過(guò)功能富集分析可以看出,馴化后的菌株發(fā)生了一系列突變,其中參與催化活性功能的相關(guān)酶基因和參與藥物代謝途徑的相關(guān)基因能與菌株的耐受性密切相關(guān),這些基因的功能注釋為進(jìn)一步明確馴化后菌株抗性機(jī)制提供重要素材??啡┖蛯?duì)羥基苯甲酸抑制了酵母的生長(zhǎng)或?qū)е螺^長(zhǎng)的滯后期,進(jìn)而降低了纖維素乙醇的產(chǎn)量和生產(chǎn)力。根據(jù)已公布的W303-1A基因組序列,對(duì)基因組進(jìn)行比對(duì),排除匹配的遺傳物質(zhì)。根據(jù)SNP/Indel注釋和發(fā)酵參數(shù)的統(tǒng)計(jì)信息,找到了與糖代謝和抑制劑抗性相關(guān)的基因(表3和表4),幾種機(jī)制可以解釋呋喃對(duì)乙醇發(fā)酵的抑制作用。在酵母細(xì)胞中,葡萄糖首先經(jīng)過(guò)糖降解途徑轉(zhuǎn)換為丙酮酸,然后丙酮酸經(jīng)過(guò)丙酮酸脫羧酶和乙醇脫氫酶生成乙醇。高濃糠醛進(jìn)入細(xì)胞后,糠醛降解過(guò)程會(huì)與TCA循環(huán)、糖降解以及PPP等途徑競(jìng)爭(zhēng)NADH和還原酶,進(jìn)而限制酵母菌生長(zhǎng)和發(fā)酵效率。其中,在糠醛存在下生長(zhǎng)的細(xì)胞粗提物中,與糖酵解相關(guān)的己糖激酶和甘油醛-3-磷酸脫氫酶的活性下降,使得乙醇脫氫酶中的NADH?和NADPH?進(jìn)行特異性還原HMF和糠醛而被消耗。此外,糠醛可以損傷DNA,阻礙RNA和蛋白質(zhì)的合成,降低酶活性,從而抑制細(xì)胞生長(zhǎng),同樣,釀酒酵母中的多種脫氫酶/還原酶能夠?qū)⒖啡┖虷MF還原為相應(yīng)的毒性較低的醇。此外,也有研究分析表明,在釀酒酵母中,糠醛會(huì)導(dǎo)致活性氧積累、液泡和線(xiàn)粒體膜損傷、染色質(zhì)和肌動(dòng)蛋白損傷。通過(guò)重測(cè)序分析發(fā)現(xiàn),進(jìn)化菌株F-2/B-2中編碼乙醇脫氫酶(alcohol dehydrogenase,ADH)、果糖-1,6-二磷酸醛縮酶(fructose-1,6-diphosphate aldolase,FBA)和丙酮酸脫氫酶(pyruvate dehydrogenase,PDH)的基因發(fā)生部分突變,這些基因與酵母的糖代謝途徑相關(guān),而脫氧酶/還原酶基因的過(guò)表達(dá)增加了糠醛還原酶的活性,從而增加了酵母對(duì)抑制劑的耐受性。Liu等的研究表明,與野生型相比,過(guò)度表達(dá)醛還原酶基因的釀酒酵母NRRL Y-12632不僅對(duì)糠醛(20 mmol/L)和HMF(40 mmol/L)的耐受性更高,而且更容易恢復(fù),生長(zhǎng)更佳。
圖6 KEGG通路突變基因的分類(lèi)
表3.與糖代謝相關(guān)主要基因的注釋結(jié)果
表4.與抑制物抗性相關(guān)主要基因的注釋結(jié)果
酵母耐受對(duì)羥基苯甲酸的生理機(jī)制與維持細(xì)胞內(nèi)pH有關(guān),這是由質(zhì)子-ATP酶泵提供的,它以ATP為代價(jià)從細(xì)胞質(zhì)中去除質(zhì)子。在糖酵解過(guò)程中,己糖激酶、磷酸果糖激酶和烯醇酶在弱酸和呋喃衍生物存在下的抑制已經(jīng)被報(bào)道。對(duì)羥基苯甲酸在釀酒酵母中引起氧化應(yīng)激,抑制蛋白質(zhì)合成,損傷DNA,可能是釀酒酵母細(xì)胞生長(zhǎng)受到抑制的原因,同時(shí)也會(huì)干擾胞內(nèi)TCA循環(huán)、糖降解以及PPP等途徑中酶的活性,影響菌株生長(zhǎng)和代謝速率。通過(guò)重測(cè)序結(jié)果和相關(guān)基因的代謝通路相結(jié)合,將釀酒酵母中與抗抑制物相關(guān)的基因與已報(bào)道的相關(guān)基因進(jìn)行綜合分析與比較,初步確定了與抑制物相關(guān)的YAP1(參與氧化應(yīng)激反應(yīng)和氧化還原穩(wěn)態(tài)的轉(zhuǎn)錄激活劑)、PDR5(耐多種化學(xué)物質(zhì)的多效ABC外運(yùn)載體)和RPN4(鋅指蛋白)基因產(chǎn)生部分突變或許是導(dǎo)致釀酒酵母中抑制因子耐受性的主要原因。
3結(jié)論
馴化策略對(duì)于構(gòu)建工業(yè)化纖維素乙醇發(fā)酵菌株十分有效。本研究通過(guò)逐漸提高壓力值-抑制物濃度的策略顯著提高了菌株的抑制物抗性,有效提高了乙醇生產(chǎn)效率。在糠醛和對(duì)羥基苯甲酸同時(shí)存在的情況下,進(jìn)化菌株的最終糖轉(zhuǎn)化率為98.4%。然而在實(shí)際預(yù)處理水解液中,抑制物的組成更為復(fù)雜多樣;并且在纖維素乙醇生產(chǎn)的發(fā)酵過(guò)程中,pH值、溫度以及五碳糖的利用都是影響發(fā)酵效率的重要因素。因此,提高菌株對(duì)多重脅迫的適應(yīng)性才能更大限度地提升生產(chǎn)效率。本研究還對(duì)出發(fā)菌株和馴化后菌株進(jìn)行了基因組重測(cè)序,結(jié)合參考文獻(xiàn)耐抑制物數(shù)據(jù)對(duì)變異點(diǎn)進(jìn)行分析挖掘,發(fā)現(xiàn)與抗抑制物有關(guān)的潛在突變位點(diǎn),并對(duì)潛在基因進(jìn)行了分析,為后續(xù)菌株構(gòu)建提供更多可能的操作靶點(diǎn)。
作者貢獻(xiàn)聲明
樊美杉:研究構(gòu)思和設(shè)計(jì)、論文撰寫(xiě)和修改;盧圣捷:數(shù)據(jù)收集和處理;張紅丹:協(xié)助實(shí)驗(yàn)操作;鐘春梅:提供技術(shù)支持;謝君:研究構(gòu)思和設(shè)計(jì)。
相關(guān)新聞推薦
1、脫除煤中有機(jī)鈉的菌株生長(zhǎng)曲線(xiàn)、影響因素及條件優(yōu)化
2、微生物培養(yǎng)、藥敏試驗(yàn)?zāi)康募皩?duì)感染治療效果的影響——資料和方法
3、豆豉纖溶酶產(chǎn)酶菌株生長(zhǎng)曲線(xiàn)與產(chǎn)酶曲線(xiàn)
