返回列表 发布新帖
查看: 94|回复: 0

[AI材料预测] MatterGPT固态材料多属性逆向设计模型

231

帖子

517

积分

53

金币

中级会员

积分
517
发表于 2025-8-4 16:04:35 | 查看全部 |阅读模式
本帖最后由 casjxm 于 2025-8-4 16:06 编辑

MatterGPT 是一种基于生成式Transformer的固态材料多属性逆向设计模型
1. 模型背景与目标
问题背景​:
  • 固态材料的逆向设计(根据目标属性生成晶体结构)面临巨大挑战,传统方法(如高通量筛选、晶体结构预测CSP)存在效率低、计算成本高、探索空间有限等问题。
  • 现有生成模型(如VAE、GAN、扩散模型)受限于架构约束、训练速度慢、生成结构有效性低,且部分模型未开源(如Microsoft的MatterGen)。
MatterGPT的创新目标​:
  • 解决表示冗余问题:传统晶体表示(如CIF文件)对欧几里得变换敏感,同一结构可有无数种表示,降低模型效率。
  • 实现多属性控制:支持同时生成满足多个目标属性(如带隙、形成能)的晶体结构。
2. 技术基础:SLICES表示法
  • 核心创新:采用SLICES(Simplified Line-Input     Crystal-Encoding System) 表示晶体结构,将晶体编码为字符串(类似SMILES表示分子)。
    • 三大组件
      • 原子符号(83种)
      • 节点索引(0-19的整数)
      • 边标签(27种,如 "+"、"-"、"o")
    • 优势
      • 对平移、旋转、置换操作不变(Euclidean-invariant)
      • 可逆性:94.95%的SLICES可精确重构为原始晶体结构
      • 简化序列:将边标签合并为单token,缩短序列长度
3. 模型架构
MatterGPT采用类ChatGPT的自回归Decoder-Only Transformer架构​:
  • 输入处理
    • SLICES字符串添加起始符 ">",填充符 "<"      至固定长度
    • 目标属性嵌入后与SLICES嵌入拼接,用类型嵌入区分二者
  • 核心组件
    • 12层Transformer Decoder
    • 768维嵌入向量,12个注意力头
    • 掩蔽多头自注意力(仅关注前序Token)
  • 训练目标:因果语言建模(CLM),预测下一Token
  • 采样策略
    • Gumbel-Softmax采样(温度T=1.2)
    • Top-p采样(top_p=0.9),增强多样性
4. 核心能力展示
​​(1)单属性条件生成
数据集​:Alex-20数据集(28万种晶体结构,原子数<20,过滤低维/金属结构)。
实验结果​:
  • 形成能(晶格不敏感属性)
    • 目标值:-1.0, -2.0, -3.0, -4.0 eV/atom
    • 有效性>92%,唯一性>89%,新颖性>56%
    • MAPE(平均绝对百分比误差)≈11%
    • 分布紧密围绕目标值:
  • 带隙(晶格敏感属性)
    • 目标值:1.0, 2.0, 3.0, 4.0 eV
    • 有效性>93%,唯一性>96%,新颖性≈40%
    • MAPE≈33%(带隙1.0 eV时升至51%,因金属-绝缘体过渡区难预测)
    • 生成结构覆盖多种晶系(图4)与元素:
​​(2)多属性协同生成
  • 目标属性对:(Eg, Ef) = (-1.0 eV/atom, 2.0 eV) 和     (-4.0 eV/atom, 4.0 eV)
  • 结果
    • 生成晶体属性分布紧密围绕目标值(图6b-c)
    • 支持复杂应用场景(如热电材料需平衡导电性与热导率)
5. 创新意义与局限性
突破性贡献​:
  • 首开Transformer用于晶体逆向设计:结合SLICES表示与GPT架构,实现高效、可控生成。
  • 多属性协同优化:解决材料设计中多目标权衡难题(如带隙与形成能)。
  • 完全开源:提供模型权重、训练代码、数据处理工具(GitHub链接)。
局限性与展望​:
  • 数据依赖:晶体数据库规模(约10^5量级)远小于分子数据库(10^6–10^7),限制模型泛化能力。
  • 未来方向
    • 扩展至高温超导、能源材料等特定任务
    • 融合多模态LLM,增强推理与发现能力
6. 工具与应用
  • 在线演示
    • Hugging Face WebApp:MatterGPT_CPU
  • 计算流程
    • 生成SLICES → SLI2Cry算法重构晶体 → DFT验证(VASP软件,PBE泛函)

总结
MatterGPT通过SLICES表示法生成式Transformer的结合,实现了高效、可控的固态材料逆向设计,支持单/多属性目标生成,并为材料科学社区提供了一套完整的开源工具链,推动能源、电子等领域的功能材料开发。

引用:
Chen, Y.; Wang, X.; Deng, X.; Liu, Y.; Chen, X.;Zhang, Y.; Wang, L.; Xiao, H. MatterGPT: A Generative Transformer forMulti-Property Inverse Design of SolidState Materials. 2024;https://arxiv.org/abs/2408.07608.

您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 微信小程序
  • 公众号
  • 微信客服

关于我们|Archiver|APP客户端|小黑屋|物质结构社区 ( 闽ICP备2024081439号-1 )

GMT+8, 2025-9-8 16:14 , Processed in 0.014777 second(s), 5 queries , Redis On.

Powered by Discuz! X5.0

© 2001-2025 Discuz! Team.

在本版发帖
科研需求联系客服
添加微信客服
返回顶部
快速回复 返回顶部 返回列表