分子性质的预测,如同破解自然界深藏的秘密,对于药物研发、材料科学等领域至关重要。只是,分子结构的复杂性和计算成本的高昂,使得这一领域的研究充满挑战。在这其中,第四范式以其创新的3D预训练模型,为分子性质预测领域带来了新的曙光。
传统的分子性质预测依赖于量子化学计算,如密度泛函理论,这种方法的计算成本高昂,速度慢,难以满足实际应用的需求。为了解决这个问题,研究人员开始将机器学习技术应用于分子性质预测,以期在保证预测精度的同时提高速度。
第四范式提出的3D预训练模型,基于生成式预训练技术,通过大规模数据集训练,使模型能够自动学习分子的3D结构信息。这一技术路线不仅避免了高昂的3D结构计算成本,还能在保证预测精度的同时,大幅提高预测速度。
第四范式的3D预训练模型在多个实验中取得了显著的成果。在OGB-LSC的Graph-level预测任务中,3D-PGT取得了第三名的好成绩,在Open Catalyst Challenge 2022上也取得了第三名的好成绩。这些成绩证明了第四范式3D预训练模型在分子性质预测领域的强大能力。
第四范式的3D预训练模型在分子性质预测领域的成功应用,为其在其他领域的拓展奠定了基础。未来,第四范式将继续探索这一技术,将其应用于更广泛的领域,为人类科技发展贡献力量。
第四范式推出的3D-PGT,通过设计自动化预训练流程,不仅大幅降低了计算成本,还显著提升了预测性能。这一框架的核心在于,它利用分子的化学键长、键角和二面角三个基本几何描述符,自动分配生成式预训练任务的权重,以融合成一个总体的预训练目标函数。
第四范式的目标是,将3D-PGT这一技术拓展到更广泛的领域,如药理学、物理学和生物学等。同时,团队也在不断优化算法,以实现更高的预测准确性和更快的推理速度。
为了更好地融合多个预训练任务,第四范式基于分子总能量设计了一个surrogate metric,自动搜索三个预训练任务的权重分布,从而实现高效的性能优化。