3. 技术方法与创新
(1) 高通量计算流程
• 结构预处理:移除溶剂分子,修复原子缺失/重叠问题。
• 多阶段优化:分步弛豫晶胞体积与原子位置。
• 性质计算:采用一致性方法计算带隙、电荷密度等。
(2) 机器学习集成
• 特征工程:
o 结构描述符:SOAP(局部原子环境)、晶体图(CGCNN)。
o 组成描述符:化学计量特征(Stoichiometric-120)。
• 模型性能:
模型 带隙预测MAE(eV) 最优场景
CGCNN 0.27 高精度回归(R²=0.88)
SOAP+KRR 0.36 结构相似性分析
化学计量特征+KRR 0.43–0.44 快速初筛
(3) 无监督分析
• 降维可视化:UMAP算法揭示结构-性质关联。
o SOAP-UMAP:按有机连接子聚类,识别低带隙区域(如TCNQ基MOF)。
o 化学计量-UMAP:按最大原子序数分区,Zn-MOF带隙普遍低于Fe-MOF。
4. 应用案例
(1) 靶向低带隙MOF发现
• 筛选策略:CGCNN预测全库带隙 → HSE06-D3(BJ)验证低Eg候选。
• 典型案例:
o TTF-Rh-TCNQ(WAQMEJ):Eg=0.71 eV,自由基连接子提升导电性(图7D)。
o Fe(bipytz)(Au(CN)₂)₂(LOJLAZ):高自旋态Eg=1.17 eV → 低温自旋转变后Eg=1.95 eV,具温度调控带隙特性。
(2) 高自旋铁位点MOF
• 筛选结果:6种含高自旋Fe的MOF,其中:
o Fe₂(dobdc)(COKNOH)和 Fe₂(dobpdc)(MALSIE)已验证为高效C-H键氧化催化剂。
o Fe(bipytz)(Au(CN)₂)₂(LOJLAZ)具自旋交叉行为,拓展电子调控维度。
5. 创新价值与影响
• 首个性质量子化学库:填补MOF电子结构数据空白,推动“材料基因组”计划。
• 加速材料设计:
o ML模型秒级预测带隙(对比DFT小时级计算)。
o 支持逆向设计(如导电MOF、光催化材料)。
• 开源共享:
o 数据库地址:QMOF GitHub
o 数据托管:Figshare(DOI: 10.6084/m9.figshare.13147324)
• 未来扩展:计划纳入更多MOF体系及多尺度性质(如载流子迁移率)。
引用:
Rosen, A. S. et al. Machine Learning the Quantum-Chemical Properties of
Metal–Organic Frameworks for Accelerated Materials Discovery. Matter 4,
1578–1597 (2021)