內科

NAR:李春權教授團隊開發SEanalysis 2.0: 一個全麵的人類和小鼠超級增強子調控網絡分析工具

作者:測序中國 來源:測序中國 日期:2023-06-06
導讀

         作為DNA調控元件,超級增強子( SE)具有富集大量轉錄因子(TF)結合並進一步顯著調控細胞關鍵基因表達的優越能力。已有研究表明,這些TF通常受關鍵信號通路的調節,在細胞發育中起著至關重要的作用。TF可以通過改變SE來影響疾病進展和細胞譜係發育。顯然,在許多生物過程的調控機製中,通路、TF、SE和基因之間的功能相互作用形成的複雜網絡尤為重要。 為此,2019年,李春權教授團隊在自主研發數據庫SE

關鍵字:  超級增強子 

        作為DNA調控元件,超級增強子( SE)具有富集大量轉錄因子(TF)結合並進一步顯著調控細胞關鍵基因表達的優越能力。已有研究表明,這些TF通常受關鍵信號通路的調節,在細胞發育中起著至關重要的作用。TF可以通過改變SE來影響疾病進展和細胞譜係發育。顯然,在許多生物過程的調控機製中,通路、TF、SE和基因之間的功能相互作用形成的複雜網絡尤為重要。

        為此,2019年,李春權教授團隊在自主研發數據庫SEdb(現已更新為SEdb 2.0)的同時,開發了在線軟件分析平台SEanalysis,用於SE的上下遊調控網絡分析。SEanalysis是SE領域的第一款基於web平台的在線SE上下遊調控網絡分析工具。團隊開發的SEanalysis軟件和SEdb數據庫等軟件平台已成為具有國際影響力的生物醫學大數據分析軟件和平台,已廣泛被美國、英國、德國、日本、法國等近100個國家的研究機構和人員使用,累計獲得10萬多次的用戶訪問量。

        文章發表在Nucleic Acids Research上

        為進一步滿足研究需求,闡明SE相關網絡的調控機製,南華大學附屬第一醫院李春權教授團隊開發了SEanalysis web平台的更新版本SEanalysis 2.0,用於全麵分析由SE、通路、TF和基因組成的轉錄調控網絡。此項工作的參與單位還包括哈爾濱醫科大學醫學信息學院、湖南省婦幼保健醫院國家衛生健康委員會出生缺陷研究與預防重點實驗室、南華大學計算機學院。SEanalysis 2.0中的SE相關樣本量是1.0版本的5倍多,顯著提高了原有SE相關網絡分析理解上下遊特異性基因調控的能力,包括“通路下遊分析”、“ 基因組區域注釋”和“上遊調控分析”。更重要的是,SEanalysis 2.0還新增了兩個分析功能:“轉錄因子調控分析”和“樣本比較分析”。為了進一步建立疾病遺傳風險與SE之間的聯係,該平台還利用風險SNP數據提供了注釋功能。

        該成果已發表在國際知名學術期刊Nucleic Acids Research上,文章題為”SEanalysis 2.0: a comprehensive super-enhancer regulatory network analysis tool for human and mouse”。

        據悉,當前的SEanalysis 2.0增加了小鼠SE,進一步擴大了人類SE的規模,研究團隊基於SEdb 2.0數據庫的H3K27ac ChIP-seq數據中增加了931個小鼠SE集和1198個人類SE集。目前,SEanalysis 2.0記錄了2670個樣本中的1,717,744個SE,包括1739個樣本的1,167,518個人類SE,以及931個樣本的550,226個小鼠SE。從數量來看,SEanalysis 2.0中SE相關ChIP-seq樣本量是1.0版本的5倍以上,顯著提高了SEanalysis 1.0中三個原有SE相關網絡分析(”通路下遊分析”、”上遊調控分析”和”基因組區域注釋”)理解上下遊特定基因調控的能力。

        同時,SEanalysis 2.0在SEanalysis 1.0的基礎上,增加了兩個新的靶基因識別策略:“JEME”和”Prestige”。SEanalysis 2.0增加了>600個人類TF和新增加755個小鼠TF,以獲得更全麵的TF-SE關係。

        隨著數據的增加,SE相關的調控網絡覆蓋了更多關於SE、TF、潛在通路和基因的調控信息。因此,SEanalysis 2.0改進了1.0中原有的三個分析功能,同時增加了兩個新的分析功能:“TF調控分析”和”樣本比較分析”,以支持對TF驅動的SE調控網絡進行更全麵的分析。

        SEanalysis 2.0的“TF調控分析”功能可幫助用戶通過SE發現目標TF調控的組織或細胞,並進一步闡明TF在特定組織或細胞中的相關功能和潛在的生物學機製。具體而言,SEanalysis 2.0首先根據“FIMO閾值”確定每個樣本中TF的範圍,輸入目標TF,設置富集顯著性p值、SE-Gene連鎖策略和FIMO閾值。對於每個樣本,通過ChIP-seq數據和motif掃描在預設的“FIMO閾值”下建立SE和注釋TF之間的關係;采用“SE-Gene連鎖策略”將SE與其靶基因進行連鎖。經過富集分析和過濾後,顯示顯著富集的樣本及其信息。隨後,用戶可以進一步選擇最多兩個目標樣本,獲得詳細的調控信息和可視化,包括調控網絡、風險SNP注釋、基因活性評分和統計信息。其中,調控網絡由帶注釋的TF、含有這些TF的通路、TF結合SE和SE相關基因組成。

        SE通常被認為是細胞/組織特異性DNA調控元件。兩個樣本中的差異和共同SE的調控網絡分析是理解上下遊特定的基因調控所必不可少的。因此,SEanalys增加了“樣本比較分析”功能,用於探討兩個目標樣本中差異和共同SE的詳細調控網絡信息,有助於評估這些SE的不同調控作用。利用SEanalysis 2.0,用戶可以通過“物種”、“組織類型”和“樣本名稱”來選擇兩個目標SE樣本。此外,用戶可以選擇多個閾值,包括FIMO閾值和SE基因連接策略。接下來,比較兩個選定樣本之間的SE基因組區域,不重疊區域作為每個樣本的特異SE,重疊區域作為每個樣本的共同SE。“樣本比較分析”輸出結果包括:所選SE樣本的詳細信息;兩個樣本中差異/共同SE對應調控網絡的表格和可視化;差異/共同SE靶基因的基因活性評分;網絡中每個節點的拓撲結構;每個疾病/性狀在SE區域內的風險SNP比率。

        SE的細胞類型特異性調控往往與重要的生物學過程和疾病有關,因此,

        SEanalysis 2.0增加了非編碼調控區域的風險SNP注釋功能,以提供與SE相關的潛在疾病/性狀信息。研究團隊從GWAS數據中收集了風險SNP信息,過濾得到與疾病/性狀相關的449,062個風險SNP,當SNP位置與SE區域的組成SE重疊時,將這些風險SNP注釋到SE區域。此外,研究人員進一步計算了每個樣本中與每種疾病/性狀相關的風險SNP數量。

        整體而言,SEanalysis 2.0構建了由SE、TF、通路和基因組成的SE相關調控網絡,支持五種SE相關分析:(i) 通路下遊分析;(ii) 上遊調控分析;(iii) 基因組區域注釋;(iv) TF調控分析;(v) 樣本對比分析。此外,SEanalysis 2.0還有助於瀏覽、搜索、下載和可視化SE。

        此外,研究人員利用SEanalysis 2.0探究了SE介導的白血病細胞標誌物TF的作用機製及調控機製,驗證了SEanalysis2.0的有效分析能力。

        近年來,大量的研究集中在SE介導的癌基因失調分子機製的臨床作用上。TF和SNP可以激活或抑製SE,並影響其上下遊調控關係。同時,越來越多的證據表明,SE可以被認為是潛在的藥物靶點。為了進一步推進機製研究,李春權教授團隊開發了SEanalysis 2.0,旨在對SE相關調控網絡進行更全麵、更靈活的分析。

        SE和TF的數據增長使得調控關係的覆蓋更加全麵,從而顯著提高了SEanalysis 2.0分析工具的能力,包括兩個新增加分析工具:“TF調控分析”和”樣本比較分析”。“TF調控分析”可以促進對SE驅動的轉錄因子調控網絡的全麵分析,“樣本比較分析”可以幫助解釋SE的細胞類型特異性調節作用。因此,SEanalysis 2.0不僅擴展了大規模SE數據,而且促進了更全麵的分析。此外,SE區域中風險SNP的富集可以在細胞類型特異性水平上提供疾病/性狀的潛在機製信息,進一步促進了對表觀基因組網絡調控的生物學機製的理解。

        總而言之,SEanalysis 2.0有助於更好地探索SE在疾病發生的分子機製和細胞生物學過程中的關鍵作用,協助研究人員更深入地了解SE。

        論文鏈接:

        https://doi.org/10.1093/nar/gkad408

        SEanalysis 2.0在線軟件分析平台鏈接:

        http://licpathway.net/SEanalysis

分享:

相關文章

評論

我要跟帖
發表
回複 小鴨梨
發表

copyright©醫學論壇網 版權所有,未經許可不得複製、轉載或鏡像

京ICP證120392號  京公網安備110105007198  京ICP備10215607號-1  (京)網藥械信息備字(2022)第00160號
//站內統計 //百度統計 //穀歌統計 //站長統計
*我要反饋: 姓    名: 郵    箱: