二、模型架构与工作流程
LCMGM分为三阶段设计:
阶段1:半监督变分自编码器(SS-VAE)
• 输入表示:钙钛矿结构(ABX₃/A₂BB'X₆)被编码为可逆网格描述符(32×32×3 RGB图像),包含:
o 标签网格:原子序数、化学计量类型。
o 性质网格:热化学特征(如形成能)。
o XRD网格:基于倒易空间衍射指纹约束晶格对称性。
• 潜空间组织:
o 学习高斯潜空间Z∈R256,通过MLP网络联合预测形成能(Ef) 和晶系分类(Cs),聚焦高稳定性区域(Ef≤−1.5eV/atom)。
o 损失函数结合KL散度、重建损失及监督任务损失。
阶段2:辅助生成对抗网络(A-GAN)
• 几何约束学习:
o 从SS-VAE提取潜空间向量 z,输入A-GAN生成合成向量 z∗。
o 生成器:输入噪声 n∗和随机晶格参数 Lp∗,输出合成潜空间向量。
o 判别器:评估 z∗真实性并预测其晶格参数 Lp和原子坐标 R(x,y,z)。
• 优势:相比传统插值采样(如SLERP),A-GAN显著提升化学多样性。
阶段3:贝叶斯优化与DFT验证
• 贝叶斯优化(BO):
o 预松弛生成材料的晶格参数,最小化DFT总能量
o 搜索空间维度按晶系约束设计,如立方晶系仅需优化单一晶格常数 a。
• DFT验证:
o 使用Quantum Espresso进行应力松弛,筛选能量稳定的材料(Ehull≤0.08 eV/atom)。
o 输出124种新型钙钛矿(65种ABX₃、59种A₂BB'X₆),涵盖立方、单斜、正交等晶系。
三、关键技术亮点
1. 可逆网格描述符
• 多模态特征融合:联合原子标签、热化学性质与XRD衍射图案,增强周期性约束学习能力。
• XRD网格作用:通过傅里叶变换捕捉倒易空间特征,显著提升晶系分类准确率(验证集F1=95.2%)。
2. 几何约束的端到端学习
• A-GAN通过隐式学习晶格参数(无需显式输入标签),生成材料的晶格误差显著降低:
o BO优化后晶格常数 a,ca, ca,c 的绝对误差改善10–15%。
o 立方/四方晶系的RMS位移最低,表明模型对高对称性结构重建能力更强。
3. 多晶型材料发现
• 模型成功生成已知组分的更稳定晶型(如RbVCl₃从六方相→四方相,能量降低)或新功能相(如立方CsZnBr₃带隙0.29 eV vs. 三斜相3.58 eV)。
引用:
Ericsson Tetteh Chenebuah, Michel Nganbe1 & Alain Beaudelaire Tchagang, A deep generative modeling architecture for designing lattice-constrained perovskite materials, https://doi.org/10.1038/s41524-024-01381-9