近日,我校大湾区环境研究院闫兵教授团队与美国罗格斯大学Zhu Hao教授团队密切合作,在纳米材料信息化和智能预测方面取得重要突破,构建了世界首个基于纳米材料结构数字化的纳米生物效应数据库。论文在线发表于《Nature Communications》。
近年来,以数据驱动的人工智能方法,在材料科学研究中得到了广泛的应用。通过机器学、深度学习等人工智能方法对材料大数据进行训练,可以构建材料结构与其性质之间的定量构效关系模型,利用这些模型,许多还没有实验和理论数据的材料性质可以被预测出来,这将大大加速新材料发现及相关研究。在这一过程中,包含材料原子结构的数据库(类似小分子数据库PubChem和生物大分子数据库Protein Data Bank)是一个必要前提和核心要素。而在纳米生物效应经历了30年的研究后,还缺少这样的数据库,以致于科研工作者们虽然坐拥庞大的纳米生物效应大数据,却不能有效地从中提取关键信息。
这项研究通过计算方法,从原子层面对实验测得的纳米材料结构进行分析,将其转换并存储为计算机可以直接读取的电子文件。利用这些电子文件,可以得到纳米结构的详细三维结构图像,这为研究者提供了有关纳米材料表面化学和理化性质的直观解析;进一步利用其所构建的新型纳米描述符,以及机器学习和深度学习方法,研究人员就可以对多种纳米材料的不同理化性质与生物效应的关联进行建模和准确预测。这个数据库通过网站(http://www.pubvinas.com/)向全世界研究人员开放,这些进展将大大加速纳米材料结构和生物效应大数据到关键信息的转换。
澳大利亚著名化学信息学家David A. Winkler评价:“这个研究课题十分重要。十多年来,涉及纳米安全评估、纳米材料设计等科研项目所追求的一个重要目标,就是构建一个包含有关纳米材料组成、结构、理化性质和生物效应等信息的数据库。”
该项研究工作得到了国家重点研发计划、国家自然科学基金以及广东省“珠江计划”引进创新创业团队等的资助。
论文原文链接——https://www.nature.com/articles/s41467-020-16413-3
(供稿:大湾区环境研究院)