2021级硕士研究生王琦以第二作者身份在国际学术期刊“Journal of Cloud Computing: Advances, Systems and Applications”发表了题为“Privacy‑preserving federated learning based on partial low‑quality data” 的研究论文。其导师王会勇副教授为第一作者。


传统的机器学习需要从参与者那里收集数据进行训练,这可能会导致参与者数据中的隐私被恶意获取。联邦学习通过将训练过程从集中式服务器转移到终端设备,提供了一种保护参与者数据隐私的方法。然而,服务器仍然可能通过推理攻击等方法获取参与者的隐私。此外,参与者提供的数据质量各不相同,低质量数据在训练过程中的过度参与可能会导致模型无法使用,这是当前主流联合学习中的一个重要问题。为解决上述问题,本文提出了一种具有部分低质量数据的隐私保护联合学习方案,获得了良好的训练结果,同时允许参与者使用部分低质量数据,从而增强联合学习方案的隐私性和安全性。此外,我们为参与者持有的数据构建了综合评估值,以减少此类数据对模型的负面影响。在MNIST数据集上的实验证明了该方案可以在部分低质量数据的参与下完成联合学习的模型训练,同时有效地保护了参与者数据的安全和隐私。与相关方案的比较也表明,我们的方案具有良好的整体性能。
该成果发表于中科院SCI三区期刊Journal of Cloud Computing: Advances, Systems and Applications。该期刊出版计算机科学技术及应用方面的研究成果,为计算机科学领域的国际权威刊物。该刊物由Springer出版,当前影响因子为4.0。