BLMM(Blank Language Model for Materials) 是一种基于自监督神经语言模型的材料生成框架,专为无机材料组成设计而开发。其核心创新在于将自然语言处理中的空白填充(Blank-Filling)技术迁移到材料化学式生成任务中,实现生成式设计(Generative Design) 和材料调优(Tinkering Design) 的双重功能。模型通过概率化学习材料化学规则(如电荷中性、电负性平衡),在保证化学有效性的同时实现高多样性生成。
技术原理与架构
1. 材料表示方法
• 化学式被展开为元素序列(如SrTiO₃ → Sr Ti O O O),序列元素按电负性排序。
• 生成过程通过画布重写(Canvas Rewriting) 实现,支持四种操作:
o E:用元素E替换空白
o _E:替换空白并在左侧插入新空白
o E_:替换空白并在右侧插入新空白
o E:替换空白并在两侧插入新空白
引用:
Lai Wei, Qinyang Li, Yuqi Song, Stanislav Stefanov, Rongzhi Dong, Nihang Fu, Edirisuriya M. D. Siriwardane, Fanglin Chen, and Jianjun Hu, Crystal Composition Transformer: Self-Learning Neural Language Model for Generative and Tinkering Design of Materials, DOI: 10.1002/advs.202304305