返回列表 发布新帖
查看: 91|回复: 0

[AI材料预测] BLMM无机材料组成设计语言模型

231

帖子

517

积分

53

金币

中级会员

积分
517
发表于 2025-8-5 18:04:45 | 查看全部 |阅读模式
BLMM(Blank Language Model for Materials) 是一种基于自监督神经语言模型的材料生成框架,专为无机材料组成设计而开发。其核心创新在于将自然语言处理中的空白填充(Blank-Filling)技术迁移到材料化学式生成任务中,实现生成式设计(Generative Design) 和材料调优(Tinkering Design) 的双重功能。模型通过概率化学习材料化学规则(如电荷中性、电负性平衡),在保证化学有效性的同时实现高多样性生成。


技术原理与架构
1. 材料表示方法

•        化学式被展开为元素序列(如SrTiO₃ → Sr Ti O O O),序列元素按电负性排序。
•        生成过程通过画布重写(Canvas Rewriting) 实现,支持四种操作:
o        E:用元素E替换空白
o        _E:替换空白并在左侧插入新空白
o        E_:替换空白并在右侧插入新空白
o        E:替换空白并在两侧插入新空白


2. 神经网络架构
BLMM包含四个核心组件:
•        Transformer编码器:生成位置和语义相关的元素嵌入。
•        空白选择网络:决策需优先填充的空白位置。
•        元素选择网络:预测填充元素的概率分布。
•        多层感知机(MLP):决定空白插入选项(E/E/E/E)。


3. 训练策略
•        损失函数设计:通过Jensen不等式优化对数似然下界,实现对生成顺序的鲁棒性。
•        高效训练算法:合并相同前缀的轨迹损失计算,显著提升训练效率。


关键性能指标
1. 生成有效性

•        电荷中性(CN)与电负性平衡(EN):
o        在ICSD-pure数据集上,生成样本的CN达89.76%,EN达84.8%(图4b),较随机基线提升4-8倍。
o        学习过程显示化学规则逐步涌现:

2. 多样性与覆盖能力
•        分布一致性:生成样本在t-SNE空间中与真实材料分布高度重叠(图2a-b),且覆盖未知区域:
•        新颖性:97.66%(二元)至95.55%(四元)为全新组成。
•        唯一性:生成百万样本后唯一性仍超50%(图3b)。


3. 恢复率(Recovery Rate)
•        测试集恢复率显著优于基线:
材料类型        BLMM恢复率        MATGAN基线
三元材料        62.37%        31.2%
四元材料        29.17%        5.2%
               
应用场景
1. 材料调优(Tinkering)

•        元素替换建议:对给定材料掩码特定元素(如SrTiO₃中掩码Ti),模型基于上下文推荐替代元素(表3):
•        化学规则学习:推荐元素符合氧化态规则(如Sr位点建议+2价元素),验证模型隐式掌握化学语法。
2. 条件生成
•        高带隙材料设计:训练集中加入带隙>1.98 eV样本,生成材料带隙分布与目标高度一致:
3. 新材料发现
•        通过DFT验证14种全新稳定材料,包括三元氮化物(如MnNiN₂)和卤化物(如Rb₂MnF₅):
优势与创新
1.        可解释性:概率生成过程揭示设计逻辑(如元素替换的化学依据)。
2.        数据效率:小数据集(如ICSD-pure仅39k样本)仍可高效学习。
3.        集成性:与晶体结构预测算法(如TCSP)无缝协作,形成完整材料发现流程。
4.        工具开放:提供开源代码及在线调优平台(http://www.materialsatlas.org/blmtinker):


总结:BLMM将Transformer语言模型的语法学习能力引入材料设计领域,通过空白填充机制实现高可控性的组成生成与调优,为加速新材料发现提供了可解释、高泛化的AI工具。


引用:
Lai Wei, Qinyang Li, Yuqi Song, Stanislav Stefanov, Rongzhi Dong, Nihang Fu, Edirisuriya M. D. Siriwardane, Fanglin Chen, and Jianjun Hu, Crystal Composition Transformer: Self-Learning Neural Language Model for Generative and Tinkering Design of Materials, DOI: 10.1002/advs.202304305


您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 微信小程序
  • 公众号
  • 微信客服

关于我们|Archiver|APP客户端|小黑屋|物质结构社区 ( 闽ICP备2024081439号-1 )

GMT+8, 2025-9-7 17:49 , Processed in 0.014324 second(s), 5 queries , Redis On.

Powered by Discuz! X5.0

© 2001-2025 Discuz! Team.

在本版发帖
科研需求联系客服
添加微信客服
返回顶部
快速回复 返回顶部 返回列表