科研进展

Nucleic Acids Research |刘琦教授团队进行CRISPR脱靶检测和预测的基准整合研究

发布时间:2020-11-04  

日前,来自同济大学生命科学与技术学院生物信息系刘琦教授课题组在Nucleic Acids Research期刊发表题为“Benchmarking and integrating genome-wide CRISPR off-target detection and prediction”的长文[3]。该论文全面系统地评估了现有CRISPR/Cas9基因编辑系统中全基因组脱靶位点的检测技术以及预测算法,并使用人工智能集成学习模型系统整合现有脱靶预测工具,开发了用于CRISPR基因编辑系统的集成脱靶预测平台iGWOSintegrated Genome-Wide Off-target cleavage Search platform,实现了更为准确的CRISPR全基因组范围类脱靶分布预测,为CRISPR基因编辑系统的优化设计和脱靶研究提供了进一步的计算指导。

 

CRISPR/Cas9系统在基因编辑和基因治疗领域具有广泛的应用。而CRISPR系统可能存在的潜在脱靶效应是制约其临床应用的瓶颈之一[1]。针对于这一问题,诸多检测CRISPR全基因组脱靶分布的实验技术(如GUIDE-seq, Digenome-seq, CIRCLE-seq等)和预测脱靶分布的算法工具应运而生。然而,这些检测技术和预测工具尚未经过系统全面的基准评估,同时设计客观而全面的基准测试以及对于现有脱靶预测工具的有效整合,将有助于深刻理解CRISPR的脱靶机制,以及进一步提升CRISPR全基因组范围内脱靶预测的精度。

 

为此,本论文对现有的CRISPR全基因组脱靶切割位点(OTS)检测技术以及OTS预测工具进行了全面的基准研究和整合分析。CRISPR全基因组OTS检测技术的基准研究将为后续全基因组OTS预测工具的基准评估提供客观的基准数据集和评估标准。同时,作者开发了一站式的CRISPR全基因组范围内脱靶位点预测和搜索的计算平台iGWOS,该平台基于AdaBoost集成学习模型将现有OTS预测算法进行整合,实现目前最优的脱靶分布预测(图1)。需要特别指出的是,该基准研究表明基于分子动力学模拟和能量优化的CRISPR脱靶预测算法普遍具有更高的预测精度,提示进一步深入理解CRISPR系统脱靶的潜在分子动力学机制,将有助于设计更好的脱靶预测工具。

iGWOS平台基于Python语言开发,使用Docker封装,方便用户使用该平台预测和分析给定gRNA的潜在脱靶切割位点。该平台支持人类多个细胞中PAM序列为NGG且错配数达到6个的CRISPR/Cas9全基因组脱靶分布预测,以及全基因组范围内高危脱靶位点的circos图可视化展示。

 

刘琦教授课题组长期从事基于人工智能和组学数据分析的基因编辑、肿瘤精准治疗、以及药物发现方面的研究工作。2018年,刘琦教授课题组基于人工智能的深度学习(Deep Learning)模型,在Genome Biology发表了针对CRISPR基因编辑系统的sgRNA优化设计工具DeepCRISPR [2]。本次工作是刘琦教授课题组继2018DeepCRISPR工作之后在CRISPR基因编辑脱靶预测领域的进一步探索。该论文第一作者是刘琦教授课题组的博士生闫纪芳,通讯作者是刘琦教授。该研究成果得到国家重大研究与发展计划,国家自然科学基金项目,上海市自然科学基金项目,上海市人工智能标准专项项目等基金的资助。

 

1.Chuai, G., et al., In-silico meets in-vivo: towards computational CRISPR-based sgRNA design. Trends in Biotechnology, 2017. 35(1): p. 12-21.

2.Chuai, G., et al., DeepCRISPR: optimized CRISPR guide RNA design by deep learning. Genome Biol, 2018. 19(1): p. 80.

3.Jifang Y., et al., Benchmarking and integrating genome-wide CRISPR off-target detection and prediction.NAR, 2020. gkaa930

 


Copyright© 2011-2015 生命科学与技术学院, All rights reserved

地址:上海市四平路1239号 电话:021-65981041 传真:65981041