本帖最后由 casjxm 于 2025-8-4 13:21 编辑
SyMat(Symmetry-AwareMaterial Generation)是一种专为周期性材料生成设计的深度学习模型,通过显式捕捉材料的物理对称性(置换、旋转、平移和周期性变换),显著提升了生成材料的化学合理性和结构稳定性。 1. 研究背景与动机 周期性材料(如晶体)由重复的晶胞单元构成,其对称性要求生成模型需满足: - 置换不变性:原子顺序不影响材料表示。
- 旋转/平移不变性:空间变换不改变材料本质结构。
- 周期性不变性:原子坐标在晶格周期性平移下等价。
现有分子生成模型(如CDVAE)无法完全满足这些约束,导致生成材料的结构失真或化学性质不合理。
2. 模型架构 SyMat采用分阶段生成策略,将材料 M=(A,P,L)分解为: - 原子类型 A和晶格 L:由变分自编码器(VAE)生成。
- 原子坐标 P:由分数扩散模型生成,以 A和 L为条件。
2.1 原子类型与晶格生成(VAE) - 对称性处理:
- 原子类型 A转化为无序集合 c={(ei,ni)}(原子类型 ei及其数量 ni),保证置换不变性。
- 晶格 L分解为长度 ℓ=[ℓ1,ℓ2,ℓ3] 和角度 ϕ=[ϕ12,ϕ13,ϕ23],保证旋转不变性。
- 网络结构:
对称感知的3D图神经网络(SphereNet)编码材料,输出潜变量 zA和 zL;解码器通过MLP预测 c、ℓ和 ϕ。
2.2 原子坐标生成(分数扩散模型)
- 对称性核心创新:
通过多图表示(Multi-Graph)将坐标分数∇Plogp(P∣A,L) 转化为边距离分数si,j,k:
其中 si,j,k由SphereNet预测,天然满足旋转/平移/周期性不变性。 - 训练与生成:
- 训练:最小化带噪边距离的分数匹配损失。
- 生成:基于退火朗之万动力学采样,逐步细化初始噪声坐标。
3. 对称性实现原理 - VAE阶段:通过目标表示(c, ℓ, ϕ)的数学变换,硬性约束置换与旋转不变性。
- 扩散阶段:
- 边距离分数 si,j,k 在多图表示中天然不变。
- 坐标分数 sis_isi 通过链式法则继承不变性,确保∇Plogp(P∣A,L) 满足对称性要求。
4. 实验效果 在三个材料数据集(Perov-5、Carbon-24、MP-20)上的实验表明: 4.1 随机生成任务 - 有效性:结构有效性达100%(表1),表明生成材料无原子碰撞。
- 分布匹配:生成材料与测试集在元素组成(#元素EMD)、密度(密度EMD)和能量(能量EMD)分布高度一致。
- 覆盖度:COV-P(生成覆盖测试集)和COV-R(测试集覆盖生成)均接近100%,证明多样性优异。
[td] 数据集 | 结构有效性↑ | 密度EMD↓ | COV-P↑ | Perov-5 | 100.00% | 0.2364 | 98.64% | Carbon-24 | 100.00% | 3.9576 | 97.59% | MP-20 | 100.00% | 0.3506 | 99.97% |
4.2 属性优化任务
- 低能量材料发现:优化潜变量后,SyMat生成的材料能量显著降低,成功率(SR)远超基线。
- 可视化效果:优化后材料结构更紧凑,能量平均降低0.5–1.0 eV/atom。
5. 总结 SyMat通过对称感知的目标表示(VAE阶段)和边距离分数扩散(坐标生成阶段),首次实现了周期性材料生成中的严格物理对称性。其在随机生成与属性优化任务中的优异表现,为新材料设计提供了可靠工具。未来方向包括加速扩散过程(如SDE采样)及拓展至非周期性材料生成。
引用: Youzhi Luo, Chengkai Liu, Shuiwang Ji,Towards Symmetry-Aware Generationof Periodic Materials, 2023, 10.48550/arXiv.2307.02707
|