NOMAD是一个综合性的计算材料科学平台,其核心架构和服务如下:
一、NOMAD的核心架构
1. NOMAD Repository(存储库)
功能:存储原始计算数据,包括输入/输出文件,支持40余种材料计算代码(如VASP、Quantum ESPRESSO等)。
数据政策:采用开放获取模式(CC BY 3.0许可),数据默认公开,支持最长3年的保密期。
标识系统:为每个计算赋予持久标识符(PID),可申请DOI实现数据引用。
规模:全球最大的计算材料科学数据集,截至2018年已收录超5000万次计算(对应数十亿CPU核时)。
2. NOMAD Archive(归档库)
数据标准化:通过解析器将原始数据转换为统一格式和单位,确保不同代码结果的互操作性。
元数据框架:建立分层元数据体系(如结构、电子属性等),支持数据检索与对比。
社区协作:与代码开发者合作维护解析器,持续扩展支持的软件工具。
二、核心服务与工具
1. NOMAD Encyclopedia(材料百科)
功能:基于归档数据的图形化界面,支持按材料性质(结构、力学、电子特性等)检索和对比。
创新点:整合多代码结果,可视化不同计算方法对材料属性的影响(如泛函选择)。
动态扩展:持续增加新材料类型(分子、表面吸附体系等)和属性(如激子行为)。
2. Advanced Visualization(高级可视化)
远程交互:提供VR工具探索多维数据(如电子轨道、激子分布)。
应用案例:CO₂在CaO表面的吸附过程、LiF中的激子行为等复杂现象的沉浸式分析。
3. NOMAD Analytics Toolkit(分析工具包)
AI驱动:集成机器学习模型用于材料发现(如晶体结构预测、性质优化)。
开放平台:支持用户上传Jupyter Notebook,共享数据算法(如Kaggle竞赛优胜模型)。
典型案例:2018年Kaggle竞赛中,参赛者通过晶体图表示法预测(AlGaIn)₂O₃的带隙与形成能,优胜方案精度超传统方法。
三、创新与社区协作
1. FAIR数据原则
可发现性:无需注册即可检索/下载数据。
互操作性:通过标准化元数据实现跨数据库集成(如与MaterialsProject、AFLOW共享数据)。
2. 人工智能驱动研究
通过众包竞赛(如Kaggle)验证AI模型在材料设计中的有效性,推动算法创新。
3. 可持续发展机制
成立非营利组织FAIR-DI,确保平台长期运营,并拓展至实验材料科学领域。
四、总结
NOMAD通过构建"存储-归档-服务"一体化平台,解决了计算材料科学数据的碎片化问题。其核心价值在于:
- 数据共享:打破代码壁垒,实现全社区数据共享;
- 智能工具链:结合可视化与AI加速新材料研发;
- 生态扩展:从计算向实验领域延伸,推动材料科学范式变革。
引用:
Draxl, C.; Scheffler, M. The NOMADLaboratory: From Data Sharing to Artificial Intelligence. J. Phys. Mater. 2019, 2, 036001.