返回列表 发布新帖
查看: 102|回复: 0

[AI结构预测] 蛋白质AI结构解析模型CrysFormer

231

帖子

517

积分

53

金币

中级会员

积分
517
发表于 2025-7-31 12:24:11 | 查看全部 |阅读模式
本帖最后由 casjxm 于 2025-7-31 12:25 编辑

1. 研究背景与问题
  • 相位问题X射线晶体学中,衍射数据仅提供结构因子振幅,相位信息丢失,无法直接通过傅里叶变换获得电子密度图。
  • 现有方法局限:传统方法(如分子置换、直接法)依赖已知模板或高分辨率数据,而深度学习模型(如AlphaFold)仅利用序列信息,未整合实验数据。
  • CrysFormer目标:直接利用X射线衍射生成的Patterson图谱(公式3)和氨基酸局部结构信息,通过深度学习预测电子密度图,规避相位问题。
2. CrysFormer模型架构
核心设计原则
  • 全局信息处理Patterson图谱蕴含全局结构信息(设计原则#1)。
  • 局部结构融合:引入氨基酸的局部电子密度图(如最常见构象)作为先验(设计原则#2)。
  • 计算高效性:避免U-Net等编码器-解码器结构,减少计算开销(设计原则#3)。
  • 端到端流程:预测的电子密度图可通过现有工具(如PHENIXSHELXE)生成原子坐标(设计原则#4)。
模型结构
  • 输入预处理
    • Patterson图谱通过3D CNN生成特征图,分块展平为token序列。
    • 局部结构(每个氨基酸独立)经另一3D CNN处理,生成token序列并添加位置编码。
  • 单向注意力机制


    • Patterson token向局部结构token执行注意力,减少计算量。
    • 局部结构token作为参考不传递至下一层,避免信息混淆。
  • Transformer模块
    • 无编码器-解码器结构,仅用多层Transformer编码器。
    • 输出token通过MLP3D CNN重建为电子密度图
  • 损失函数
    • 联合损失:99.99% MSE + 0.01% Pearson相关系数,后者是晶体学常用指标。
3. 技术创新
  • Patterson图谱的直接利用:从衍射数据直接生成,规避相位问题。
  • 局部结构注意力:将氨基酸标准构象作为可学习的先验信息,增强局部细节预测。
  • 高效注意力设计:单向注意力减少计算量,适合3D数据(复杂度 O(S×(S+SJ))Stoken数)。
4. 实验验证
数据集
  • 二肽数据集2残基/晶胞):24,000个蛋白质片段,单位晶胞尺寸可变。
  • 15肽数据集15残基/晶胞):16,585训练集+1,623测试集,固定晶胞尺寸(41Å×30Å×24Å),溶剂含量>90%(简化问题)。
性能对比​​
[td]  
   方法      平均Pearson      平均相位误差      训练时间/epoch   
  U-Net (基线)    0.735    67.40°    28.93 min  
  CrysFormer    ​0.939    ​**35.16°**    ​12.37 min

  • 可视化对比CrysFormer更准确还原芳香族残基(如色氨酸)等复杂结构。
​15肽结果
  • Pearson相关系数达0.77(经回收训练),相位误差67.66°
  • 自动结构解析成功率
    • PHENIX固定密度图拟合:76%案例R-free < 0.38
    • SHELXE多聚丙氨酸骨架建模:74%案例衍射振幅Pearson > 0.25
5. 局限与展望
  • 当前局限:仅验证高溶剂含量小肽,未覆盖真实蛋白晶体(低溶剂含量、复杂对称性)。
  • 未来方向
    • 扩展至可变晶胞尺寸、空间群(非P1对称性)。
    • 局部结构包含多残基片段,提升实用性。
  • 影响:与AlphaFold互补,为无模板蛋白结构解析提供新范式。
总结
CrysFormer首次将Transformer引入晶体学相位问题,通过Patterson图谱全局信息局部结构注意力的融合,实现了高效、准确的电子密度预测,为蛋白质结构解析开辟了深度学习驱动的新路径。代码与数据集已开源(GitHub链接)。

引用:
Pan, T. et a. CrysFormer: protein structuredetermination via Patterson maps, deep learning, and partial structureattention. Struct. Dyn. https://doi.org/10.1063/4.0000252 (2024).

您需要登录后才可以回帖 登录 | 注册

本版积分规则

  • 微信小程序
  • 公众号
  • 微信客服

关于我们|Archiver|APP客户端|小黑屋|物质结构社区 ( 闽ICP备2024081439号-1 )

GMT+8, 2025-9-8 15:41 , Processed in 0.015371 second(s), 5 queries , Redis On.

Powered by Discuz! X5.0

© 2001-2025 Discuz! Team.

在本版发帖
科研需求联系客服
添加微信客服
返回顶部
快速回复 返回顶部 返回列表