返回列表 发布新帖
查看: 105|回复: 0

[AI结构预测] WyCryst无机晶体生成AI框架

231

帖子

517

积分

53

金币

中级会员

积分
517
发表于 2025-8-4 11:20:05 | 查看全部 |阅读模式
本帖最后由 casjxm 于 2025-8-4 11:22 编辑

WyCryst框架是一个创新的无机晶体生成设计框架,旨在解决晶体结构预测(CSP)中的对称性约束问题,并通过结合机器学习与密度泛函理论(DFT)实现高效的材料发现。WyCryst的核心优势在于其显式集成晶体空间群对称性(通过Wyckoff位置表示),确保生成的晶体结构在生成和后续优化过程中保持物理意义和稳定性。


1. 框架概述
WyCryst框架是一种数据驱动的生成式设计工具,专注于无机晶体的逆设计。其目标是通过学习晶体对称性(空间群和Wyckoff位置)和目标属性(如形成能、带隙),生成具有指定空间群和化学组成的新晶体结构。该框架解决了传统生成模型(如VAE、GAN和扩散模型)的局限性:许多模型在生成晶体时忽略空间群内对称性约束,导致生成的结构在DFT弛豫后失去对称性或无效。WyCryst通过三大关键组件实现高效、可靠的晶体生成:
•        Wyckoff位置为基础的无机晶体表示:将晶体编码为对称性约束的特征。
•        属性导向的变分自编码器(PVAE)模型:学习晶体分布并引导潜在空间朝向目标属性。
•        自动化DFT工作流:用于结构精炼和稳定性验证。
整个框架从晶体信息文件(CIF)输入开始,经Wyckoff表示编码、PVAE模型生成,最后通过DFT优化输出最终晶体结构。该设计确保了对称性在生成和优化过程中一致保持,显著提升结构有效性和稳定性。


2. 核心组件详解
(a) Wyckoff位置为基础的无机晶体表示
WyCryst的核心创新是将晶体表示为基于Wyckoff位置的特征,显式编码空间群对称性。Wyckoff位置描述了原子在单位晶胞中的对称等价位置,每个空间群(共230种)有固定的Wyckoff位点(包括通用位置和特殊位置),这些位点定义了原子的自由度(DoF)。表示形式包括:
•        空间群数组(Si ):One-hot编码的230维向量,标识晶体的空间群编号。
•        Wyckoff数组(Xi=(Fi,Vi,Wi)):
o        Fi :化学计量矩阵,one-hot编码元素的化学式(如CaTiO₃)。
o        Vi:原子特征矩阵,源自晶体图卷积神经网络(CGCNN),包含原子属性(如电负性、半径)。
o        Wi :Wyckoff位点占用矩阵,描述每个元素在Wyckoff位点的多重性和自由度(DoF)。例如,DoF=0表示原子位置完全固定(对称操作不变),DoF=3表示需优化3个参数。
这种表示确保了生成的结构自动满足空间群对称性,且可逆性强——从表示到最终晶体结构的DFT弛豫只需微小调整。关键优势是避免传统方法中原子位置和晶格常数的随机性,提升结构有效性至100%(文献中定义的有效性标准:所有生成结构可通过DFT弛豫且原子间距离>0.5 Å)。


(b) 属性导向的变分自编码器(PVAE)模型
PVAE模型是生成部分的核心,它学习晶体数据的分布并引导潜在空间朝向目标属性。模型架构包括编码器、解码器和属性学习分支:
•        编码器:使用卷积神经网络(CNN)将Wyckoff数组映射到潜在空间,输出均值(Zmean)和方差(Zvariance ),定义多元高斯分布。
•        解码器:从潜在空间重构Wyckoff数组,生成新晶体的“Wyckoff Genes”(即对称性约束的晶体构建块)。
•        损失函数:确保对称性遵守和属性学习:
o        重构损失(Lrecon):结合均方误差(MSE)和交叉熵,最小化输入与重构的Wyckoff数组和空间群数组的差异(公式1)。
o        KL散度损失(L_{KL}}):正则化潜在空间为高斯分布(公式2)。
o        属性损失(Lprop):通过全连接网络连接潜在空间与目标属性(如形成能、带隙),最小化预测值与真实值的MSE(公式3)。
o        Wyckoff损失(LWyckoff):关键创新点,计算真实化学式与重构对称性加权公式的MSE,惩罚违反空间群对称性的生成(公式4)。这确保原子位置和晶格常数无需显式预测,而是通过对称性“snap-to-grid”优化。
潜在空间可视化(图1c)显示属性导向效果:形成能(Ef)梯度在PCA图中清晰可见,且不同晶系(如立方和三角晶系)形成聚类,证明模型捕捉了对称性和属性的关联。


(c) 自动化DFT工作流用于结构精炼
生成的Wyckoff Genes通过自动化DFT工作流转化为实际晶体结构并进行优化:
•        过滤步骤:应用可靠性和实验可行性过滤器(如化学式检查、Wyckoff位点验证、合成可行性评分),筛选无效或不可合成的候选。
•        初始结构生成:使用PyXtal库生成满足对称性的未弛豫结构,确保原子间距离大于共价半径下限(避免无效结构)。
•        DFT弛豫:通过VASP软件进行能量优化,约束空间群对称性。对于非零DoF的Wyckoff位点,生成多个候选结构(数量=总DoF + 1),确保捕获自由度变化。优化后仅保留能量最低的结构。
•        稳定性验证:使用密度泛函微扰理论(DFPT)计算声子色散,检查动态稳定性(无虚频模式)。DFT设置包括精确k点网格和收敛标准,确保高保真度(文献中对比了机器学习势如M3GNET,但DFT在保持对称性上更优,如表S1所示)。
该工作流高效平衡计算成本:PVAE生成和采样为低开销步骤(秒级),而DFT弛豫和声子计算较耗时(小时级),但避免了全局能量搜索,仅需局部弛豫。


3. 验证与性能评估
WyCryst通过leave-one-out验证和生成新材料的实验证明其有效性。所有测试基于Materials Project数据库的66,643个三元化合物。
(a) PVAE模型性能
•        重构准确率:在5-fold交叉验证中,PVAE的元素重构准确率达99.9%,Wyckoff位点准确率92.6%,空间群准确率91.8%。显著优于基准模型(如FTCP VAE),且结构有效性达100%。
•        前向模型性能:Wyckoff表示在属性预测(形成能Ef、带隙Eg、合成性SC)中优于CGCNN,与FTCP相当。证明对称性信息足以描述材料稳定性。
(b) leave-one-out验证
•        基态CSP任务:给定化学式预测最低能量结构。例如,CaTiO₃(空间群62)和BaTiO₃(空间群160)的验证中,WyCryst成功生成132个和126个候选结构,经DFT弛豫后识别出实验已知的基态结构,晶格参数与文献一致。这表明框架能准确导航潜在空间找到能量最小值。
•        多态CSP任务:给定化学式和特定空间群预测多形体。成功再现CaTiO₃(SG 221)、SrTiO₃(SG 221)、CsPbI₃(SG 221)和CuInS₂(SG 122)的高温或特定相结构。晶格参数与实验值吻合(如CsPbI₃的a=6.36 Å vs. 实验6.36 Å),证明框架在约束空间群下的鲁棒性。
•        等效Wyckoff Genes:框架自动识别等效Wyckoff位置(如CaTiO₃的钛原子可占位4a或4b位点),通过对称操作(如平移)互换,无需额外训练。这体现模型对晶体对称性的内在理解。


4. 新材料的生成与应用
WyCryst生成639个Wyckoff Genes(基于用户定义的元素列表),通过过滤器筛选出102个可行候选,输入DFT工作流。最终生成8个声子稳定的新材料:
•        新化合物:包括Cu₃SnSe₄、RbBiTe₂、BiGeTe₂、Bi₄ZrTe₆、Bi₃Ge₄Te₄、AgSbTe₄、Bi₂TiTe₄和Bi₂VTe₄,这些在Materials Project数据库中未记录。其中7个为全新材料(仅RbBiTe₂有文献报道但无结构数据)。
•        结构分析:声子色散显示所有材料动态稳定(无虚频),如Cu₃SnSe₄的结构和声子谱与已知类似物Cu₃SbSe₄高度相似,预示实验可行性。但部分材料(如Bi基化合物)存在异常氧化态或短原子间距,需未来工作整合配位环境信息改进。


5. 结论与意义
WyCryst框架通过显式集成Wyckoff位置对称性,解决了生成式晶体设计中的关键挑战:生成结构的物理有效性和对称性保持。其三大组件——对称性约束表示、属性导向PVAE和自动化DFT工作流——协同实现了高效、可靠的晶体逆设计。验证实验证明其在基态和多态CSP任务中的准确性,而新材料生成展示实际应用潜力。未来工作可扩展至无序材料或整合更多原子特征(如配位环境),但WyCryst已为AI驱动的材料发现迈出重要一步。框架代码开源(GitHub: https://github.com/RaymondZhurm/WyCryst),促进社区应用。


引用:
Ruiming Zhu, Wei Nong, Shuya Yamazaki, Kedar Hippalgaonkar, WyCryst: Wyckoff Inorganic Crystal Generator Framework, Matter, 2024, 3469.




您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 微信小程序
  • 公众号
  • 微信客服

关于我们|Archiver|APP客户端|小黑屋|物质结构社区 ( 闽ICP备2024081439号-1 )

GMT+8, 2025-9-9 05:54 , Processed in 0.014475 second(s), 5 queries , Redis On.

Powered by Discuz! X5.0

© 2001-2025 Discuz! Team.

在本版发帖
科研需求联系客服
添加微信客服
返回顶部
快速回复 返回顶部 返回列表