加入收藏 | 后台管理 | 学校主页

张艳菊团队在蛋白质赖氨酸丙二酰化位点分析与预测方面获重要进展

作者: 时间:2019-08-18 点击数:

赖氨酸丙二酰化(Lysine Malonylation)是将丙二酰基团从丙二酰辅酶A转移到赖氨酸残基上的一种化学修饰。近期研究发现,赖氨酸丙二酰化能调控肝脏组织中葡萄糖和脂肪酸的代谢,并与二型糖尿病和肥胖症等高发病率的代谢疾病相关。因此,对赖氨酸丙二酰化位点的精准识别有助于人们深入了解相关疾病的发病机理以及治疗方法。

目前,基于机器学习模型预测丙二酰化位点的计算方法存在特征或机器学习算法较为单一等问题,针对这些不足,本研究提出了一整套赖氨酸丙二酰化位点预测的方案。首先,我们对蛋白质序列进行了全方位的特征提取,主要包括三大类:基于序列本身的特征提取算法、基于氨基酸物理化学性质的特征提取算法、基于遗传进化信息的特征提取算法,共计11种不同的特征编码方式。然后设计实现了一种新的集成机器学习模型,称为kmal-sp,该模型融合了支持向量机、随机森林、梯度提升决策树、K近邻和逻辑回归五种机器学习算法的优势。

实验结果发现(1)KNN、LOGO以及AAINDEX在任一数据集上都是表现最好的特征提取算法。(2)随机森林、支持向量机和LightGBM在三个物种上表现总是最优的并且集成算法性能高于单一机器学习方法。(3)在独立测试集上与现有的最先进的预测器(MaloPred)相比,优化的集成模型在三个物种数据集上的性能全面领先(大肠杆菌、小鼠和人类的AUC的值分别为0.930, 0.923, 0.944)。

为了最大便利地使实验科学家对蛋白质序列中的赖氨酸丙二酰化位点做预测,我们将的集成学习模型开发了一个用户友好、易于使用的赖氨酸丙二酰化位点在线预测服务器(http://kmalsp.erc.monash.edu/)。

Yanju Zhang, Ruopeng Xie, Jiawei Wang, André Leier, Tatiana T Marquez-Lago, Tatsuya Akutsu, Geoffrey I Webb, Kuo-Chen Chou, Jiangning Song; Computational analysis and prediction of lysine malonylation sites by exploiting informative features in an integrative machine-learning framework, Briefings in Bioinformatics, bby079, Aug,2018

2014-2019 © 广西图像图形与智能处理重点实验室
通讯地址:广西壮族自治区桂林市七星区金鸡路1号
邮编:541004