|
Point Cloud-based Crystal Diffusion (PCCD) 是一种基于点云表示和扩散概率模型的晶体结构生成框架。该模型通过将晶体结构编码为点云数据,结合去噪扩散概率模型(DDPM),实现了高效且高保真的晶体结构生成,显著提升了生成结构的能量稳定性和多样性。
核心创新点
1. 点云晶体表示法
• 三通道数据结构:
o 位置通道:存储原子相对坐标(128个点),通过晶格向量转换为绝对坐标。
o 元素通道:存储原子元素概率(三元组概率分布)。
o 晶格通道:存储晶格参数(α, β, γ, a, b, c),扩展为128项以匹配点云维度。
2. 扩散模型架构
• U-Net主干网络:
o 训练阶段:逐步添加高斯噪声至晶体点云,模型学习噪声分布。
o 生成阶段:从随机噪声出发,通过反向去噪过程逐步重建晶体结构。
o 损失函数:最小化预测噪声与真实噪声的差异。
3. 数据预处理优化
• 晶格参数归一化:将晶格向量长度除以15,限制生成范围至[-1,1],避免数值溢出(但导致长晶格预测误差)。
• 数据集构建:从Materials Project筛选52,028个晶体(≤3元素,≤16原子位点),保留带隙与磁序作为控制变量。
性能验证
1. 结构重建能力
• 原子数量预测:67.81%样本准确预测原子数(1280个样本中868个正确)。
• 晶格参数误差:
o a/b/c轴有效率88.48%/90.55%/89.40%,相对误差≤5.23%。
• 原子坐标误差:x/y/z坐标有效率70.83%/71.60%/72.02%,相对误差≤10.05%。
2. 生成结构稳定性
• 能量稳定性:62.68%生成结构(746个中468个)的Ehull < 0.25 eV/atom,16.35%(122个)Ehull < 80 meV/atom,显著优于PGCGM(5.3%)和iMatGen(0.36%)。
• DFT验证:Ca₂SnO₄、Mg₃CdO₄、MgSc₂O₄等生成结构经弛豫后显示非零带隙和稳定声子谱。
3. 结构多样性
成功生成一元(Si)、二元(H₂O)、三元(Mg₂Mn₃O₈)体系及复杂结构(CaZn₃O₄, La₂ZnO₄, MgFe₂O₄),证明模型广泛适用性。
技术优势与局限
优势
• 生成质量:扩散模型优于GAN/VAE,生成结构稳定性显著提升。
• 计算效率:点云表示降低计算开销(对比体素表示)。
• 泛化性:支持≤3元素的任意组合晶体生成。
局限
• 晶格长度限制:归一化导致晶格长度>15Å的结构预测误差增大。
• 周期性边界处理:原子坐标在[0,1]区间边界处重建精度下降(图1e)。
应用前景
PCCD为逆向晶体设计提供新范式:
1. 通过指定元素组合生成候选结构,加速新材料发现。
2. 生成结构经DFT验证后扩充材料数据库(如Materials Project)。
3. 可扩展至更多元素体系及缺陷结构生成(文献讨论部分)。
开源资源:
• 代码:https://github.com/lzhelin/CrystalDiffusion
• 数据:Materials Project (https://next-gen.materialsproject.org/)
引用:
Zhelin Li, Rami Mrad, Runxian Jiao, Guan Huang, Jun Shan, Shibing Chu, Yuanping Chen, Generative design of crystal structures by point cloud representations and diffusion model, 2024, https://orcid.org/0009-0000-8909-1786
|
|