近年来的研究发现相分离形成的无膜细胞器在大量的生命活动中发挥着重要作用。相分离蛋白之间形成的多价非共价相互作用主要通过两种方式实现:一种是通过内在无序区域(intrinsically disordered region,IDR)之间的相互作用,另一种是通过模块结构域之间的相互作用。鉴于已知结构的蛋白质数量有限,现有的相分离蛋白预测方法只利用了蛋白质的序列特征,没有整合模块结构域的结构特征,预测结果强烈偏好于含有IDR的蛋白,对于不含IDR的相分离蛋白预测效果不佳。
2024年3月8日,同济大学生命科学与技术学院张勇课题组与中国科学院上海有机化学研究所刘聪课题组合作在Nature Communications上发表了题为Machine learning predictor PSPire screens for phase-separating proteins lacking intrinsically disordered regions的文章,开发了预测不含有IDR的相分离蛋白的机器学习方法PSPire。
张勇课题组开发了PSPire方法:首先使用训练数据集中蛋白质的AlphaFold预测结构作为输入,计算了这些蛋白质的序列和结构特征,并利用这些特征训练了一个XGBoost分类器。PSPire通过整合蛋白质的序列和结构特征,能够高效筛选不含IDR的相分离蛋白。在多个数据集上的评估表明,相较于现有的相分离蛋白预测工具,PSPire对于不含IDR的相分离蛋白质预测的准确性有了极大的提升,进一步证实了蛋白质结构信息在解码相分离过程中涉及的多价相互作用的重要性。刘聪课题组实验验证了PSPire的预测能力,测试的11个候选相分离蛋白中有9个被证实能够在细胞内发生相分离。
同济大学张勇教授和中国科学院上海有机化学研究所刘聪研究员为该论文的共同通讯作者,同济大学研究生侯爽和中国科学院上海有机化学研究所研究生胡姣姣为共同第一作者。该工作得到了国家自然科学基金委、国家科技部、上海市科委的支持。
Copyright© 2011-2015 生命科学与技术学院, All rights reserved
地址:上海市四平路1239号 电话:021-65981041 传真:65981041