增強(qiáng)子操作
來源/作者:普拉特澤-生物醫(yī)學(xué)整體課題外包平臺(tái)
上一篇師姐帶我們一起學(xué)習(xí)了增強(qiáng)子的理論知識(shí),那現(xiàn)在我們就一起來學(xué)習(xí)一下如何用增強(qiáng)子數(shù)據(jù)來進(jìn)行增強(qiáng)子的預(yù)測以及序列下載吧。
一、數(shù)據(jù)庫EnhancerAtlas(http://www.enhanceratlas.org/index2.php)
首先先給大家介紹一下如何用EnhancerAtlas來進(jìn)行增強(qiáng)子的預(yù)測和序列下載。演示:首先在瀏覽器中輸入EnhancerAtlas,進(jìn)入該網(wǎng)站的首頁,首頁顯示了該數(shù)據(jù)庫的數(shù)據(jù)來源及增強(qiáng)子的數(shù)量:這個(gè)數(shù)據(jù)庫包含了來自170種細(xì)胞或組織共4,506,217個(gè)人類增強(qiáng)子信息和來自150種細(xì)胞或組織共2,811,699個(gè)小鼠增強(qiáng)子信息。
該數(shù)據(jù)庫有多種檢索方式,支持直接輸入基因名稱或者基因組特定區(qū)域,查看在該區(qū)域內(nèi)的增強(qiáng)子,同時(shí)還能比較增強(qiáng)子在不同細(xì)胞系中的表達(dá)。以鼠源基因klf4為例來演示如何在這個(gè)數(shù)據(jù)庫中預(yù)測增強(qiáng)子,在選框中選擇物種,選擇細(xì)胞或組織,輸入基因名稱,點(diǎn)擊search,跳轉(zhuǎn)到結(jié)果頁面。
該數(shù)據(jù)庫采用了基因組瀏覽器的展示形式,每一行稱之為track。最上方顯示了檢索的范圍為小鼠4號(hào)染色體的55342150-55750150bp,即目的基因上下游各20kb,可調(diào)節(jié)滑輪來控制檢索的位置。黑色字體對應(yīng)行表示每種方法檢測到的該區(qū)域reads覆蓋結(jié)果(如P300、DNA超敏位點(diǎn)、轉(zhuǎn)錄因子結(jié)合位點(diǎn)、組蛋白修飾及染色質(zhì)修飾因子等),有些基因還會(huì)有紅色字體,為對應(yīng)行為綜合多種方法得到的增強(qiáng)子區(qū)域的結(jié)果。由圖可知,該數(shù)據(jù)庫在這個(gè)范圍內(nèi)共預(yù)測到6個(gè)與該基因相關(guān)的增強(qiáng)子,從左到右依次為1-6,2號(hào)、3號(hào)、6號(hào)增強(qiáng)子在幾種增強(qiáng)子特征物處都被檢測到,說明這個(gè)位置是潛在的增強(qiáng)子所處的位置,可作為我們的重點(diǎn)關(guān)注對象。點(diǎn)擊show the details可查看每個(gè)增強(qiáng)子的細(xì)節(jié)(包括增強(qiáng)子ID、增強(qiáng)子在染色體上的位置等),點(diǎn)擊download也可下載預(yù)測到的每個(gè)增強(qiáng)子的序列,用于后續(xù)CHIP實(shí)驗(yàn)的引物設(shè)計(jì)。
同時(shí)該數(shù)據(jù)庫也可以比較增強(qiáng)子在不同細(xì)胞或組織中的表達(dá),檢索框示意如下:選擇想要比較的細(xì)胞系或組織,結(jié)果顯示了該基因在不同細(xì)胞中的增強(qiáng)子情況,可以看到2號(hào)增強(qiáng)子在各細(xì)胞或組織中相對保守,在后續(xù)研究中可作為重點(diǎn)關(guān)注對象。同樣可以點(diǎn)擊進(jìn)去查看各細(xì)胞系中的增強(qiáng)子信息細(xì)節(jié)及下載增強(qiáng)子序列。
二、dbSuper數(shù)據(jù)庫(http://asntech.org/dbsuper/)
dbSUPER是超級(jí)增強(qiáng)子數(shù)據(jù)庫的開山之作,收錄了人和小鼠中的超級(jí)增強(qiáng)子信息(兩種方式:一是從PubMed中收集已發(fā)表的,有文獻(xiàn)支持的超級(jí)增強(qiáng)子;二是利用ENCODE, GEO等公共數(shù)據(jù)庫下載H3K27ac chip_seq數(shù)據(jù)后采用MACS識(shí)別增強(qiáng)子區(qū),ROSE識(shí)別超級(jí)增強(qiáng)子區(qū))。對于human而言共收錄了來自102種不同細(xì)胞/組織共69205個(gè)超級(jí)增強(qiáng)子;對于mouse而言共收錄了來自25種不同細(xì)胞/組織共13029個(gè)超級(jí)增強(qiáng)子信息。但是該數(shù)據(jù)庫只是提供了超級(jí)增強(qiáng)子區(qū)域的染色體位置等基本信息,缺乏對超級(jí)增強(qiáng)子區(qū)域內(nèi)的其他基功能元件的注釋。
進(jìn)入該數(shù)據(jù)庫首頁,點(diǎn)擊左邊的Detailed Search,然后選擇參考基因組(人或鼠),選擇細(xì)胞或組織類型,輸入基因名稱,選擇增強(qiáng)子識(shí)別因子類型點(diǎn)擊search,即可得到預(yù)測結(jié)果,預(yù)測結(jié)果顯示了根據(jù)不同的增強(qiáng)子結(jié)合蛋白鑒定出來的超級(jí)增強(qiáng)子和增強(qiáng)子,并顯示了該結(jié)果的細(xì)胞或組織來源。點(diǎn)擊超級(jí)增強(qiáng)子ID進(jìn)去后會(huì)呈現(xiàn)該增強(qiáng)子和關(guān)聯(lián)基因的相關(guān)信息(該超級(jí)增強(qiáng)子的位置等),右邊為關(guān)聯(lián)基因的相關(guān)信息,有些基因的信息會(huì)有錯(cuò)誤,建議直接點(diǎn)進(jìn)NCBI的鏈接進(jìn)去看基因的相關(guān)信息。然后將左側(cè)的超級(jí)增強(qiáng)子的序列位置輸入進(jìn)來,即為超級(jí)增強(qiáng)子的序列。下方還顯示了超級(jí)增強(qiáng)子的組分增強(qiáng)子的信息,同樣將這些位置輸入到NCBI中,可查看每個(gè)組分增強(qiáng)子的序列。
如果需要查看基因、增強(qiáng)子/超級(jí)增強(qiáng)子、轉(zhuǎn)錄因子等調(diào)控網(wǎng)絡(luò),可用下面兩個(gè)數(shù)據(jù)庫。
三、SEdb數(shù)據(jù)庫(http://www.licpathway.net/sedb/)
該包含了來自542個(gè)樣本的總共331601個(gè)超級(jí)增強(qiáng)子,采用了H3K27ac組蛋白修飾作為增強(qiáng)子區(qū)的標(biāo)記,和dbSuper一樣,該數(shù)據(jù)庫也利用從ENCODE、 RoadMap、 GEO等公共數(shù)據(jù)庫中下載的H3K27ac chip-seq數(shù)據(jù)后采用MACS識(shí)別增強(qiáng)子區(qū),ROSE識(shí)別超級(jí)增強(qiáng)子區(qū)。該數(shù)據(jù)庫包含許多超級(jí)增強(qiáng)子注釋(SNP位點(diǎn)、Enhancers、TFBS等),且可通過6種不同策略對超級(jí)增強(qiáng)子的靶基因進(jìn)行預(yù)測。
瀏覽器中輸入這個(gè)網(wǎng)址:http://www.licpathway.net/sedb。這個(gè)網(wǎng)站不太好找。然后可以根據(jù)基因名稱或基因位置來進(jìn)行檢索。以基因SOX4為例,選擇物種,輸入基因名稱,點(diǎn)擊search,得到預(yù)測結(jié)果,點(diǎn)擊SE ID可查看詳細(xì)信息,右邊還能看到基因、轉(zhuǎn)錄因子、超級(jí)增強(qiáng)子及信號(hào)通路的共同調(diào)控網(wǎng)絡(luò),往下翻可以看到與超級(jí)增強(qiáng)子結(jié)合的轉(zhuǎn)錄因子及與超級(jí)增強(qiáng)子關(guān)聯(lián)的信號(hào)通路,下方還有SNP位點(diǎn)的分析(網(wǎng)絡(luò)不好的時(shí)候加載不出來)。
四、SEA數(shù)據(jù)庫(http://sea.edbc.org)
該數(shù)據(jù)庫包含了11個(gè)物種164,545個(gè)超級(jí)增強(qiáng)子(人,小鼠,果蠅,線蟲,斑馬魚,雞,黑猩猩,恒河猴,綿羊,非洲爪蟾和棘背魚)以及3,361,785個(gè)典型增強(qiáng)子。同時(shí)提供超級(jí)增強(qiáng)子區(qū)域的染色質(zhì)相互作用、SNPs、轉(zhuǎn)錄因子結(jié)合位點(diǎn)信息。
瀏覽器中輸入網(wǎng)站,進(jìn)入官網(wǎng)后點(diǎn)擊上方的Search Engine,根據(jù)自己的實(shí)驗(yàn)需求選擇物種,識(shí)別因子,選擇檢索增強(qiáng)子或超級(jí)增強(qiáng)子,選擇在編碼區(qū)或非編碼區(qū)檢索,選擇染色體,輸入基因名稱,選擇細(xì)胞或組織類型。這里以人源TP53基因?yàn)槔?,選擇human,識(shí)別因子,檢索增強(qiáng)子或超級(jí)增強(qiáng)子,在編碼區(qū)或非編碼區(qū)檢索這三項(xiàng)都選擇All,選擇17號(hào)染色體,輸入基因名稱,點(diǎn)擊search。結(jié)果顯示了增強(qiáng)子和超級(jí)增強(qiáng)子的信息,包括在染色體上的位置,長度,關(guān)聯(lián)基因,細(xì)胞組織來源,增強(qiáng)子識(shí)別因子等。點(diǎn)擊Visual就可以跳轉(zhuǎn)到UCSC上看到可視化的信息了(目前無法查看)。點(diǎn)擊關(guān)聯(lián)我們的目的基因的增強(qiáng)子ID即可查看詳細(xì)信息。左側(cè)展示了該超級(jí)增強(qiáng)子的基本信息以及轉(zhuǎn)錄因子的情況,右側(cè)展示了增強(qiáng)子、基因,轉(zhuǎn)錄因子的調(diào)控網(wǎng)絡(luò)。
大家可以分別用這些數(shù)據(jù)庫去預(yù)測,綜合分析后篩選出符合自己實(shí)驗(yàn)需求的增強(qiáng)子或超級(jí)增強(qiáng)子。那關(guān)于增強(qiáng)子部分的內(nèi)容就介紹到這里了,紙上得來終覺淺,絕知此事要躬行,希望大家打開電腦跟著一起操作。同時(shí)別忘了給我們一鍵三連喲!祝大家科研順利!還有實(shí)驗(yàn)相關(guān)的疑問可以加入我們實(shí)驗(yàn)交流群哦!