速递:比Foldseek更快更准的结构搜索Progres

经过两年多的发展,Martin Steinegger课题组的Foldseek系列工具已经成为了领域内的重要工具。然而,最近的更新展示了另一款名为Progres的结构搜索工具,它以显著优势超越了Foldseek。

Progres在敏感度和精度上都超越了Foldseek,并且在计算时间上优于Foldseek和Dali。作者利用图神经网络(GNN)训练Progres,实现了不依赖序列的蛋白质结构嵌入,并在SCOPe上采用监督对比学习进行模型训练。实验结果显示,在不同分类中,Progres在敏感度上与Dali接近,优于Foldseek。

在比较图中,Progres在多数情况下展现出了最高的敏感度,尤其是在短序列和高接触顺序的情况下,这一特点使得Progres在结构搜索中具有显著优势。

尽管Progres在性能上表现出色,但其存在一定的局限性。它主要针对结构域进行搜索,而非含有多个结构域的复合结构,且在面对新出现的结构域时,由于采用了监督学习,Progres可能会遇到困难。

这一成果令人兴奋,但也提出了进一步改进的需求。解决Progres在处理多结构域复合结构和处理未知结构域的局限性,将是提升其应用范围的关键。持续更新和优化Progres,使其能够应对更广泛的结构搜索需求,将是作者未来的研究方向。