相關文獻
轉錄因子靶基因預測,不用到處搜了,都在這了
我們在做分子機制時,確定了某些分子比如circ、lnc、或者mRNA時,希望知道他的上游調控分子是什么,是哪個轉錄因子調控他的表達,需要預測轉錄因子-靶基因調控關系?;蛘?,我們確定了一個重要蛋白,要看看他調控的蛋白是什么,再者我們研究ceRNA機制,我們希望miRNA的靶基因是一個轉錄因子,比如Myc,因為轉錄因子的改變極容易引起一系列基因的表達變化,進而引起通路變化,輕松導致細胞表型發生改變。
在與老師討論高通量測序的結果時,我們不得不去面對一個嚴酷的事實。老師們原以為,做了表達譜篩選實驗,篩選出部分差異基因/lnc/circRNA,然后進行驗證不就可以了嘛。拿到數據時會發現沒那么簡單。
因為,如果您樣品準備的合適,測序實驗操作也沒問題時,您可能會找到幾百個,一兩千個差異基因,腫瘤樣品高達三四千個差異表達基因??吹綌祿r的老師要蒙了,怎么這么多差異基因/lnc/circRNA,我要挑哪個分子驗證,我要挑哪個分子做機制。哪個分子才是這個處理下的核心分子,關鍵分子呢?其實想一想,既然觀察到細胞表型(比如增殖、凋亡、遷移)或者組織有明顯的改變,想必中間定不是幾個基因或者一二十個差異基因能改變的了的,恐怕真的要幾百、上千個基因的變化才足以引起細胞/組織可觀察的表型變化吧。
老師問我哪個基因是最重要的,可以用來研究的、說實話,我不知道,該挑哪個分子。我會開始自責,作為一個分析人員,怎么能不會這個問題,收了老師的錢,怎么能不幫他們解決呢,良心何安啊。不久,心情恢復,想想,我可以幫老師做各樣能做的分析,比如各類數據庫的挖掘,出各種能出的圖(備注:不額外收費),幾乎隨叫隨到,從不知疲倦。想想有些老師在別的公司受到的非人的待遇,我應該可以自我安慰了。想想沒有哪個公司的分析人員能告訴你,挑哪個分子做,就能做出機制。然而,這個問題總不能一直困擾我們。與其抓鬮碰運氣的選一個,不如尋找更多的信息提供一下參考也好嘛。于是,我覺得是不是可以結合一些數據庫進行一下數據的整合預測呢。
今天談轉錄因子。轉錄因子靶基因預測最有效的實驗還是ChIP-seq。In brief, 使用轉錄因子的抗體,抓取與其可以結合的DNA片段,通過分析檢測這些DNA片段定位到哪個基因上,即可以推斷,該轉錄因子可能調控哪個基因。
有些網站可以輔助進行預測,比如http://bioinfo.life.hust.edu.cn/hTFtarget#!/。今天我們介紹的GTRD http://gtrd.biouml.org/數據庫。該數據庫為俄羅斯某學者整理,論文發表于2016年,數據持續更新中。不知道他們是為了發文章,還是覺得應該為科研出份力,但他們做的工作我很喜歡,在SRA、ENCODE、GEO等資源庫收集一切可以下載的ChIP-seq數據,然后在自己服務器上跑程序鑒定結合位點,并將數據公開下載。
這個庫主要收集各個模式物種轉錄因子。以下是該數據庫目前收錄物種、樣品量、轉錄因子數量統計表。
從表中看出人共有7239個ChIP-seq數據,涉及852個轉錄因子(約占已知轉錄因子一半)。數據量還是很可觀的,而且我相信,您在苦苦尋找的轉錄因子或者正在研究的轉錄因子很可能就在其中。
該數據給出了簡單的網頁搜索,可以查詢轉錄因子的靶基因,搜索方式如圖:
然,本人感覺并不好用,于是將其鑒定結果進行下載,并重新注釋。您可以在后臺回復相應數字、獲取轉錄因子靶基因下載鏈接。直接在對應表格中尋找。
該數據老師可以直接找到對應的轉錄因子,去查看涉及到哪些靶基因。需要說明的是轉錄因子與靶基因的結合具有時空動態性。這里列出的靶基因也是在當時的實驗條件下是這樣的,是不是在您的實驗中也發生這樣的靶基因關系呢,或許是,或許不是,但別的實驗條件/細胞可以發生,至少證明這個關系對理論上是可以的,您的實驗中也很有可能存在這樣的關系。
回到最初的話題,篩選到大量的差異基因,該如何評估基因的重要性呢。假如您想要確定一個轉錄因子,可以在差異基因中篩選差異表達的轉錄因子,而后分別預測他們的靶基因,當然靶基因也是有差異表達的,進一步可以預測這些靶基因涉及到的pathway通路或生物學過程等,這時我們或許會更能了解,哪個轉錄因子在所有差異基因是關鍵的,地位是重要的,據此可以挑選出這個重要基因,而后進行后續機制研究。(看起來簡單,操作很難?找我們就好了。)
那么其他差異基因能否可以依照此辦法進行功能重要性評估呢?But,普通基因沒有這種明顯的靶基因關系。不容易去尋找他們的靶基因,但問題總要解決的,其他基因的分析我們在后續討論,有需要可以關注我們公眾號??!
上海生因生物專業提供基因組測序、微生物測序、轉錄組測序(RNAseq)、外外泌體RNA測序,高通量測序數據標準分析、個性化分析,各類圖表繪制,及GEO、TCGA數據挖掘服務。有需要的聯系我們。
微信掃描二維碼關注公眾號回復數字 “1811141” 獲取轉錄因子靶基因預測列表
其他相關文獻解讀
文獻解讀:轉錄因子→circRNA表達→吸附miRNA→腫瘤基因 2
文獻解讀:cSMARCA5 --> 吸附miR-17-3p/miR-181b-5p --> TIMP3 --> 抑制HCC (IF:14)
文獻解讀:轉錄因子 --> circRNA表達 --> 吸附miRNA --> 促進靶基因表達 --> 上皮-間質轉化