当前,纳米材料在电子机械、医疗化工、能源环境等诸多领域的研究、应用迅速发展,但纳米材料的环境效应预测存在高内涵数据库缺乏、环境转化情景遗漏、模型普适性弱等问题,严重制约了国家对危害性纳米材料的风险防控。
记者7月18日从南开大学获悉,该校环境科学与工程学院胡献刚教授团队在拓展机器学习算法预测纳米材料的生物效应,以及通过增强机器学习的可解释性,从而探索纳米材料生物效应的机理方面取得了突破,为上述问题的解决提供了新的研究思路。相关论文发表在国际知名期刊《科学进展》上。
据介绍,为有效控制和削减环境污染物, 必须首先了解污染物的产生源头、分布特征、转化规律以及毒性效应, 进而对污染进行治理或修复,这就需要对化学品进行环境效应预测。这是国家对危险化学品进行风险防控的重要手段,也是当前毒理学研究的重要方向。在2005年发生的松花江污染事件、大气雾霾成因等重大环境问题上,环境生物效应预测发挥了不可替代的作用。
目前,在对纳米材料的环境生物效应预测中,机器学习模型已广泛应用,但是受限于机器学习的可解释性,利用机器学习模型揭示复杂纳米毒理的机制仍具有很大的难度。
胡献刚教授团队在前期工作基础上创建了纳米材料—生物效应数据库,构建了纳米材料—生物效应回归模型,并提出了一个基于树的随机森林特征重要性和特征网络交互分析框架(TBRFA),该框架通过多指标重要性分析方法,克服了小型数据集导致的特征重要性分析偏差,并利用随机森林的工作机制建立了特征交互网络,揭示了潜在的影响纳米材料生物效应的交互因素。
TBRFA包含重要性分析与特征交互网络分析。TBRFA重要性分析采用多个重要性指标,以平衡传统的单一指标带来的偏见,并识别出暴露恢复时间、材料比表面积以及材料尺寸是影响纳米材料诱导生物效应的重要因素。TBRFA特征交互网络分析通过解析随机森林的树结构,计算出两两特征之间的交互作用系数,并识别出材料的比表面积与表面电荷、比表面积与长度、长度与直径之间在诱导生物效应过程中如何相互制约与影响。
胡献刚表示,这项研究对研发环境友好型纳米材料具有一定的指导作用,将为纳米材料的生态环境安全性评估提供新的策略;该机器学习算法除了适用于纳米材料环境效应分析,也可用于重金属、有机物污染等环境生物效应的预测、评估。