細胞穿膜肽是一種小分子多肽,能夠容易地穿過細胞膜。這類分子,尤其是具有靶向功能的CPPs為高效率投送藥物到靶細胞帶來希望。 因此,對其展開研究對于生物醫學有著一定的意義。本工作主要從序列水平對具有不同穿膜活性的CPPs進行研究,試圖找出影響CPPs穿膜活性的因素,以及不同活性CPPs與非穿膜肽(NonCPPs)序列上的差異,并引入一種分析生物序列的方法。
基于CPPsite數據庫和不同的文獻獲取CPPs和NonCPPs序列,并進一步從CPPs序列中提取具有高、中、低穿膜活性的穿膜肽(HCPPs、MCPPs、LCPPs)用于構建數據集。基于這些數據集,開展了以下研究:
首先,利用方差分析的方法,對不同活性的CPPs以及NonCPPs的氨基酸及二級結構組成進行分析,發現氨基酸的靜電與疏水相互作用對CPPs的穿膜活性起到了重要影響,同時螺旋結構和無規卷曲也會影響CPPs的穿膜活性;
其次,使用理化性質與長度將不同活性的CPPs展示在二維平面上,發現在某些特殊的性質下不同活性的CPPs與NonCPPs可以產生聚簇現象,HCPPs、MCPPs以及LCPPs和NonCPPs被分成了三簇,這種現象顯示了它們之間的差異;
最后,本文引入了生物序列理化質心的概念,將組成序列的殘基看作質點,進而把序列抽象成質點系進行研究,并將此方法應用到CPPs的分析中,通過PCA方法將不同活性的CPPs投射到三維平面上,結果發現絕大部分CPPs聚在一起,部分LCPPs與NonCPPs聚在一起。
此工作對于CPPs的設計,以及理解不同活性CPPs序列上的差異具有一定的意義。
另外,本文引入的生物序列理化質心的分析方法也可以用于其他生物問題的分析,同時它們可以作為某些生物分類問題的輸入參數,在模式識別中起到一定的作用。