二、核心创新:数据驱动的物理对称性整合
sGDML的核心突破在于自动发现并利用分子系统的物理对称性,显著提升数据效率和模型精度:
1. 对称性分类
o 全局时空对称性:旋转/平移不变性(空间)、能量守恒(时间)。
o 局部分子对称性:刚性对称(如苯环的D6h点群)和动态非刚性对称(如甲基旋转)。
2. 对称性发现算法
o 多部图匹配(Multipartite Matching):基于分子构象的邻接矩阵Aij=∥ri−rj∥,通过最小化欧氏距离实现原子映射。
o 最小生成树(MST)优化:解决双向匹配的传递性冲突,构建全局一致的置换图P。
三、技术实现:对称化核函数与高效训练
1. 对称化核函数构造
将对称操作Pq 整合至梯度域机器学习(GDML)核函数:
Hess(κsym)(x,x′)=∑qSHess(κ)(x,Pqx′)Pq
通过系数收缩技术,模型参数数量保持不变,避免计算复杂度因对称操作数量SSS增加而**式增长。
2. 力场预测器
力预测公式为:
f^F(x)=∑iM∑l3N∑qS(Pqαi)l∂xl∂∇κ(x,Pqxi)
3. 训练流程
o 从500K的DFT-MD轨迹中玻尔兹曼采样构型。
o 重组高精度标签:在选定构型上计算CCSD(T)级能量/力。
o 超参数网格搜索与交叉验证优化泛化性能。
引用:
S. Chmiela, H. E. Sauceda, K.-R. Mu¨ller and A. Tkatchenko, Towards exact molecular dynamics simulations with machine-learned force fields, Nat. Commun., 2018, 9, 3887.