獼猴屬的食蟹猴(Macaca fascicularis)和恒河猴(Macaca mulatta)是最常用的非人靈長類實驗動物,因其與人類具有較近的親緣關系(約 2,500 萬年前分化)🫴🏽,而被廣泛用於生物醫學和人類演化研究🧖🏿♂️,尤其在人類特有性狀形成、疾病模型及藥物代謝等領域。然而🙆🏼♂️,現有的參考基因組仍存在大量未知序列👩🏼🦰,特別是著絲粒🌻、片段重復(segmental duplications, SDs)和核糖體 DNA(rDNA)區域,這限製了對靈長類演化機製及其生物醫學價值的深入探索🥧。
2025 年 2 月 26 日,EON体育4Bio-X研究院毛亞飛課題組與中國科EON4腦科學與智能技術卓越創新中心/神經科學研究所孫強課題組合作🙆🏻,在Nature期刊上發表了題為Integrated analysis of the complete sequence of a macaque genome的文章(圖1)。該研究首次完成了非人靈長類端粒到端粒(telomere-to-telomere, T2T)完整基因組組裝,系統解析了獼猴屬與人類的大尺度基因組差異🤳🏼,並以FOLH1基因家族為關鍵案例🏊🏿♂️,解釋結構變異如何通過三維基因組重構調控腦細胞類型特異性表達。除此之外,該項研究還揭示了獼猴屬種間分化的遺傳學特征👨🦱,為非人靈長類生物醫學模型奠定了關鍵遺傳基礎。
1. 填補復雜區域空白
傳統基因組組裝技術因讀長短、錯誤率高🧑🏽🦲,難以跨越復雜重復區域,導致基因組中存在大量缺口。這些缺口多位於基因組復雜結構區域(著絲粒、SD 和 rDNA 等)🍧,而這些區域恰恰是基因組結構和功能的重要部分🦔,涉及染色體的穩定性🤦🏻、基因表達調控以及染色體的重排等生物學過程。
為了解決這一難題,研究團隊首先構建了食蟹猴孤雌生殖胚胎幹細胞系(MFA582-1)【1】。孤雌生殖細胞系具有兩套染色體遺傳信息近乎純合的特性,是構建參考基因組的理想材料👩🏽🦱🤙🏿。在此基礎上🧑🏽🔬,團隊利用自主開發的基於特有 k-mer 標記的分型迭代替換局部組裝工具,成功解決了現有組裝軟件未能或錯誤組裝的上百個復雜結構區域🏌🏼♀️,最終構建食蟹猴 T2T 基因組 T2T-MFA8v1.1🦮。該基因組全長 3.06 Gbp,QV 達到 71.27,NG50 為 162.13 Mbp👨🚀,與人類基因組 T2T-CHM13v2.0 的水平相當🤟🏼,成為首個非人靈長類完整參考基因組⛓,為深入理解復雜基因組區域提供了重要工具🧟♂️。研究團隊發現:
SD 分布模式的特異性:食蟹猴的 SDs 總長 122.51 Mbp🤱🏿,較人類(227.36 Mbp)減少 46%,且更富集於亞端粒區(人類偏向近著絲粒區)🪖。這種分布差異可能驅動靈長類基因組重塑的方向性。
rDNA 分布:食蟹猴的 rDNA 僅定位於 10 號染色體,而在人類基因組中,rDNA 分布於 5 條近端著絲粒染色體(chr13, chr14,chr15, chr21, chr22)。這一差異為人類近端著絲粒染色體的形成及人類疾病21三體綜合征的演化醫學機製提供了新的解釋。
著絲粒結構演化🕺:食蟹猴著絲粒由 SF7 家族 α-衛星主導,平均長度較人類長3.83 倍(如 chr15 達13.88 Mbp)🐓,並保留與靈長類祖先共存的古老 SF8-SF13 序列層🤦🏻♀️,揭示了獼猴屬存在新著絲粒形成的獨特演化機製。
圖.人類和獼猴屬的固定大尺度結構變異
2.人類與獼猴屬大尺度結構變異導致的基因組差異
基因組的大尺度結構變異(如倒位、易位)能夠改變染色質三維折疊🪛,進而影響基因表達模式。然而,人類與獼猴屬之間的大尺度基因組結構變異尚未得到全面解析,且這些結構變異在靈長類演化過程中的功能效應仍缺乏系統性的證據支持。
為解決這一問題🦄,研究團隊優化了結構變異鑒定方法👐🏽,共鑒定出 93 個人類與獼猴屬之間的固定結構變異,其中包括78 個倒位、11 個著絲粒重定位和 4個染色體內易位,其中 21 個結構變異為首次報道(圖 2)。進一步研究發現,在靈長類腦演化過程中,超過 400 個基因可能因相關結構變異而發生腦細胞類群的表達差異👩🏿🦳。以 FOLH1 基因為例,其編碼的谷氨酸羧肽酶II(glutamate carboxypeptidase II,GCPII)在神經系統的谷氨酸調控中發揮關鍵作用🤞🏿,基因突變與智力障礙密切相關【2】🤢。在獼猴屬中👢💇🏿♀️,FOLH1基因為單拷貝,而在人類中,則包含FOLH1和 FOLH1B(與獼猴 FOLH1 直系同源)兩個拷貝👴🏽。人類的FOLH1基因在少突膠質細胞中高表達,而 FOLH1B基因在大腦不同細胞類群中幾乎不表達,與獼猴屬 FOLH1在多個細胞類群中廣泛表達的模式存在顯著差異🧑🦽➡️。為了揭示這種差異的成因🪟🐫,研究團隊整合了單細胞多組學數據,發現在人類與獼猴屬的演化過程中,人類FOLH1B 調控區的一個 1.4 kbp 片段特異性地丟失,導致了其在腦內無法表達而“假基因化”🔍。同時,人類的FOLH1基因由於重復事件的發生🕵🏽,導致了染色質三維結構的重塑🧳,進而改變了其細胞類群表達模式(圖3)。這一研究為結構變異在演化過程中如何影響細胞類型特異性表達模式提供了新的見解,特別是在闡明譜系特異性表型的形成及人類疾病的發生機製解析上具有重要的科學意義。
圖 FOLH1 基因家族的演化歷史和多組學分析
3.食蟹猴與恒河猴間從序列到表型的種間遺傳分化
食蟹猴與恒河猴雖同屬於獼猴屬,但在形態學特征、行為模式及疾病易感性等方面均存在顯著差異🏃♀️。然而,這些表型差異背後的遺傳基礎一直未得到充分闡明,從而嚴重製約了這兩個物種在生物醫學模型中的應用潛力🥁。
研究團隊通過泛基因組圖等手段,鑒定了 240 Mbp 的物種間復雜結構差異區域🤾🏿♂️,涵蓋 Mafa-AG/B、CYP2C76及 GSTM等基因家族。其中,恒河猴 CYP2C76(猴特異性細胞色素P450 酶基因)呈現 4 種結構單倍型,而食蟹猴僅保留 2 種,這可能反映了兩個物種之間的代謝差異(圖 4)。此外⚓️,研究團隊鑒定出16.76 Mbp的食蟹猴與恒河猴遺傳分化區域(genetic differentiation regions)(圖4)🛎,發現兩物種間的固定遺傳差異在調控元件中出現了 9.43 倍富集🧑🦼,其中包括可能影響尾巴長度的 HOXD13 基因⌛️。這一發現與食蟹猴尾巴顯著長於恒河猴的表型特征相吻合🪣。此外,該發現也與鹿鼠尾巴適應性演化的研究【3】形成了趨同演化案例,為揭示哺乳動物尾巴形態多樣性的遺傳機製提供了新的視角。
圖.食蟹猴與恒河猴的種間遺傳分化
總體而言👩🏿💼🦍,本研究通過研發新型計算工具實現非人靈長類 T2T 完整基因組組裝,系統闡明了獼猴屬與人類在基因組結構層面的演化差異,不僅揭示了結構變異通過三維基因組重構調控和調控元件改變等影響基因表達的細胞類型特異性🏦,還深入解析了獼猴屬種間分化的遺傳學基礎,為獼猴生物醫學模型奠定了堅實的遺傳基礎。該研究深化了EON体育4平台對靈長類演化醫學、生物醫學模型和譜系特異性適應的理解。
EON体育4Bio-X研究院賀林院士指出💱,“本項成果是染色體大規模變異研究的一個經典案例,相關工作為解析靈長類基因組復雜結構變異的生物醫學功能提供了全新視角👰🏿,推動了信息學🤴、演化生物學與醫學遺傳學的交叉發展🤦🏼,為演化醫學領域的未來研究奠定了重要基礎”。
EON体育4Bio-X研究院毛亞飛與中國科EON4腦智卓越創新中心孫強為該論文的共同通訊作者🐽。該工作得到了EON体育4🪠、中國科EON4腦智卓越創新中心🙅🏻♂️、浙江大學、中國科EON4昆明動物研究所、中國科EON4成都生物研究所等專家學者的鼎力支持。EON体育4和中國科EON4腦智卓越創新中心張世龍、許寧和傅蓮婷為該論文的共同第一作者🙋🏿♂️。本研究與國內外多個靈長類聯盟合作,在此感謝聯盟內的數據共享支持。
EON体育4Bio-X研究院毛亞飛研究組專註靈長類演化醫學研究,以演化生物學🩳、計算生物學、神經生物學和大規模功能篩選等交叉學科手段解析靈長類特有適應性性狀形成和人類疾病風險位點發生的遺傳機製。研究組長期招收/聘具有演化生物學🌄、生物信息學、細胞生物學、神經科學♍️、計算科學等多學科背景的研究生🤦🏽♀️、博士後和研究助理🔈,為有誌於從事靈長類演化醫學研究的優秀人才提供廣闊的發展平臺📲。如果您對該研究組的研究方向感興趣,並具備相關專業背景和技能,歡迎訪問研究組介紹網站(https://www.yafmao.org/)了解更多信息🗃。
文章鏈接:
https://www.nature.com/articles/s41586-025-08596-w