返回列表 发布新帖
查看: 11|回复: 0

[AI材料预测] MODNet小样本材料机器学习框架

228

帖子

494

积分

53

金币

初级会员

积分
494
发表于 昨天 11:35 | 查看全部 |阅读模式
MODNet(Material Optimal Descriptor Network)是一种针对小样本材料数据集设计的机器学习框架,通过结合物理特征选择、联合学习和神经网络架构优化,显著提升了材料属性预测的准确性。


1. 模型核心设计
MODNet基于三大关键技术:
•        物理特征选择:从材料结构、成分和物化性质中提取具有物理意义的特征(如原子质量、空间群、键长等),通过归一化互信息(NMI)算法筛选最优特征子集,减少冗余并抑制维度灾难。
o        选择公式:
RR(f)=[maxfs∈FsNMI(f,fs)]p+cNMI(f,y)
其中 p 和 c 是动态超参数,平衡特征与目标的相关性(Relevance)和特征间冗余性(Redundancy)。
•        联合学习(Joint Learning):通过树状神经网络架构(图1)同时预测多个相关属性(如熵、焓、比热),共享底层编码层知识,提升小样本泛化能力。
•        分层神经网络:采用前馈神经网络,按属性相似性分组解码,从通用材料表征逐步细化到具体属性预测。


2. 性能优势
(1)小样本预测精度显著提升
•        振动熵预测:在1245个样本的数据集上,305K振动熵的测试误差仅 0.009 meV/K/atom(比此前研究低4倍),联合学习进一步降低误差8%(表2)。
•        横向对比(表1):在训练样本量<4000时,MODNet超越主流模型(如MEGNet、SISSO):
属性        训练样本量        MODNet MAE        MEGNet MAE
形成能 (eV/atom)        504        0.210            0.342
带隙 (eV)                     504        0.71              0.94
折射率                         3240      0.05               0.08
(2)误差分布更集中
•        图2显示MODNet在振动熵预测中误差分布更窄,尤其在样本量少时优势明显:

3. 特征选择的价值
•        提升精度:在小数据集(n=200)中,特征选择降低误差达12%。
•        物理解释性:筛选出的关键特征揭示物理机制,例如:
o        振动熵主要受平均键长(AGNI指纹)和p价电子范围(离子性)影响。
o        折射率与带隙和密度强相关。
•        算法对比:当特征数>10时,MOD特征选择法(MOD-Selection)优于Pearson、SISSO等方法。


4. 应用场景
•        温度/压力函数预测:联合学习可一次性输出温度依赖属性(如熵、比热随温度变化曲线),图3展示Li₂O的预测结果与DFT计算高度吻合。
•        材料设计加速:比传统量子计算方法快数量级,适用于高通量筛选。

总结
MODNet通过物理特征选择降低小样本过拟合风险,联合学习架构共享属性间知识,树状解码实现复杂函数预测,为材料科学中小数据集建模提供了高效、可解释的解决方案。其代码已开源(GitHub: ppdebreuck/modnet),支持扩展至成分预测等任务。


引用:
De Breuck, P. P.; Hautier, G.; Rignanese, G. M. Materials property prediction for limited datasets enabled by feature selection and joint learning with MODNet. npj Comput. Mater. 2021, 7 (1), No. 83.


您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 微信小程序
  • 公众号
  • 微信客服

关于我们|Archiver|APP客户端|小黑屋|物质结构社区 ( 闽ICP备2024081439号-1 )

GMT+8, 2025-8-7 15:56 , Processed in 0.014263 second(s), 5 queries , Redis On.

Powered by Discuz! X5.0

© 2001-2025 Discuz! Team.

在本版发帖
科研需求联系客服
添加微信客服
返回顶部
快速回复 返回顶部 返回列表