中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

编辑 | 萝卜皮

低温电子断层扫描(cryoET)允许原位细胞结构的可视化,这对于细胞结构的研究十分重要。然而,由固有的「缺失楔形」问题引起的各向异性分辨率在断层图像的可视化和解释方面造成了巨大困难。

在这里,中科大的研究人员开发了 IsoNet,这是一个基于深度学习的软件包,它使用从原始断层图像中学到的知识,迭代地重建缺失的楔形信息并提高信噪比。IsoNet 无需子断层图像平均,生成的断层图像具有显著降低的分辨率各向异性。

该研究以「Isotropic reconstruction for electron tomography with deep learning」为题,于 2022 年 10 月 29 日发布在《Nature Communications》。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

单粒子 cryoEM 的出现使得通过平均数十万个粒子以 2-4?? 分辨率确定孤立的大分子复合物的结构成为常规操作,从而实现原子建模。然而,这些复合物的生物学功能是通过它们的相互作用来实现的,并且通常取决于它们在细胞或亚细胞器内的空间排列。例子比比皆是,从多形病毒到细胞器,再到神经元之间的突触等大规模细胞结构。

许多病毒,特别是那些参与破坏性大流行的病毒,如 SARS-CoV-2、流感病毒和人类免疫缺陷病毒 (HIV),其蛋白质和基因组的组织是多形的。细胞器,例如包含围绕中心对的微管双联体的轴丝,虽然在不同物种的核心元件中很大程度上是保守的,但它们依赖于它们与外围成分的非保守和可变附着,这些外围成分定义了它们特有的物种特异性功能。在神经元中,突触内的分子组织,而不是单独的分子,可能是突触可塑性的基础,突触可塑性通常被认为是学习和记忆的细胞基础。不幸的是,这种组织信息或「分子社会学」在单粒子冷冻电镜中丢失了。

为了揭示这种跨病毒或细胞内部的「分子社会学」,低温电子断层扫描 (cryoET) 已成为首选工具。这种技术需要收集一系列不同倾斜角度的图像,称为「倾斜系列」。由于辐射损伤,有限的电子剂量必须在整个倾斜系列中进一步分馏,从而导致冷冻断层图中的低信噪比(SNR)。

此外,随着倾斜增加样品的有效厚度,cryoET 的倾斜范围通常限制在约 ±60°。较高倾斜角处的缺失视图导致重建的 3D 断层图像的各向异性分辨率,沿 Z 轴的分辨率最低。在傅立叶空间中,这些缺失的视图会导致两个连续的、相对的楔形区域(通常称为「缺失楔形」)中缺乏信息。这种缺失的楔形在细胞 cryoET 的 3D 重建中导致严重的伪影,表现为例如椭圆形突触小泡。因此,连同重建断层图像中的低信噪比,缺失楔形伪影的存在阻碍了对 3D 重建密度的直接解释,这是 cryoET 承诺解决原位分子组织的关键。

先前的尝试已经通过先验假设(例如,密度正性和溶剂平坦度,两者都是二元的)来部分恢复缺失楔形中的信息,以约束重建断层图像中的结构特征。然而,考虑到生物系统的复杂性,这种二元假设的信息内容(或「熵」)有限,并且可能并不总是成立(例如,细胞空间的某些区域可能包含非膜结合相的物质,而不是扁平溶剂)。或者,双轴断层扫描依赖于用两个垂直的倾斜轴对同一样本进行成像,将两个缺失的楔形物减少为两个缺失的金字塔;因此,它有可能减轻产生的断层图像中的伪影。然而,双轴倾斜系列的采集和对准比单轴倾斜系列复杂得多,并且可能浪费用于倾斜系列采集的已经有限的电子剂量。事实上,迄今为止,并没有从双轴断层扫描中获得比纳米分辨率更好的结构。

众所周知,深度神经网络可以学习非线性或高维复杂数据的关系。在计算机视觉中,卷积神经网络(CNN)已应用于各种任务,例如对象识别、图像分割和分类,通常可以实现高性能。在 cryoEM 社区中,基于 CNN 的神经网络被应用于粒子拾取任务并且优于传统方法,例如高斯拉普拉斯方法。深度学习还应用于 cryoET 断层扫描图,用于去噪、粒子拾取、分类和分割,加速断层扫描图的解释和分析。其中,DeepFinder 和 EMAN2 可以在不考虑缺失楔形伪影的情况下生成大分子的分割掩码。

基于深度学习的方法还用于采用在监督分类任务中学习的特征空间的无监督子断层图分类。这些方法中的 Noise2Noise 策略(即,从图像的一个噪声实例学习到另一个噪声实例)不需要无噪声的基本事实,并且仅对噪声的独立性和零均值统计做出假设。然而,尽管最新的 EMAN2 版本试图用 cycleGAN 来填补缺失的楔形,但它无法恢复可靠的大规模信息,例如平板膜;其他软件包均未处理 cryoET 中的缺失楔块问题。因此,CNN 是否可以将可靠信息恢复到 cryoET 重建的「缺失楔形」中尚未得到探索。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

图示:IsoNet的原理和工作流程。(来源:论文)

在这里,中国科学技术大学的研究人员开发了一个基于深度学习的软件包 IsoNet,用于克服困扰所有当前 cryoET 方法的缺失楔形问题和低 SNR 的局限性,它可适用于像素大小为 10? 的低分辨率断层图。

为了证明其稳健性,他们应用 IsoNet 处理三种代表性类型的 cryoET 数据——分离的核糖体和病毒、具有 PFR 的细胞器轴丝和神经元突触——代表三个复杂程度。

IsoNet 显著提高了所有这些情况下的结构可解释性,使研究人员能够解决未成熟 HIV 衣壳、动力蛋白亚基和真核鞭毛中副鞭毛杆的剪刀堆叠网络结构中晶格缺陷的新结构,和神经元突触内含七边形的网格蛋白笼。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

图示:IsoNet 纠正了核糖体数据集的缺失楔形伪影。(来源:论文)

在生成的断层图中,原位蛋白质特征呈现出各向同性并且具有高质量,有时与通过子断层图平均获得的质量相匹配。对于断层图中的无定形结构,例如膜,IsoNet 允许网络从断层图中的许多其他类似结构中学习特征表示,并恢复丢失的信息。因此,IsoNet 通过克服其固有的缺失楔形问题扩展了 cryoET 的实用性,从而实现了结构的 3D 可视化,这些结构要么像细胞中的结构那样复杂,要么像患者组织断层图中的结构那样罕见。值得注意的是,IsoNet 优于旨在处理缺失楔形问题的程序包 ICON 和 MBIR。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

图示:IsoNet 揭示了未成熟 HIV 衣壳中的晶格缺陷。(来源:论文)

从哲学上讲,没有信息可以从真空/无中产生。IsoNet 从哪里恢复丢失的信息?这些问题涉及深度学习的基础知识,可以被认为与空间信息的非局部性有关。通过从原始断层图中分散的信息中学习具有重复结构形状的信息,IsoNet 巧妙地消除了扭曲或丢失的信息。

IsoNet 方法的巨大优势在于可以自动发现和「平均」跨不同维度的相似特征。这些特征可能与三个笛卡尔维度的平移和旋转方式有关,例如结晶 PFR 亚基和轴丝微管;它们也可以通过对称性相关,例如网格蛋白笼的五边形和六边形;它们可能在生物学上相关,例如蛋白质仅由 20 个氨基酸和 4 个碱基的核酸组成,并且两者在几何上都被限制为线性分子;最终,它们也可能与自然信号的组成性有关,例如水平取向的碳膜可以分解成共同的特征,包括点、线和平面。IsoNet 学习它们在同一个断层图中或多个断层图中的关系,并自动重建这些特征。本质上,IsoNet 和 subtomogram averaging 通过相同的原理来补偿 missing-wedge 问题。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

图示:缺失楔形校正后显示的 PFR 架构。(来源:论文)

尽管在处理噪声数据(例如 cryoET 数据)时应始终考虑过度拟合。IsoNet原则上不会混淆相似的分子而导致过拟合。这是因为在 IsoNet 神经网络中,缺失信息恢复是跨多个尺度进行的,它从非常局部的区域(例如,3 × 3 × 3 体素)开始检测到非常大的区域(例如,64 × 64 × 64 体素)的特征。即使是相似分子之间最细微的差异也会在小范围内占据主导地位。在这种规模下,IsoNet 算法将对人为地向分子中添加小成分进行惩罚。

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

中科大团队开发基于深度学习的电子断层扫描各向同性重建软件包

图示:IsoNet 恢复了神经元突触断层图中缺失的信息。(来源:论文)

无论信息恢复的细节如何,IsoNet 提供的地图可解释性的实质性改进现在允许结构可视化以进行功能解释,而无需繁琐且耗时的子断层图平均,这通常涉及先验特征识别和手动粒子拾取。通过 IsoNet 在细胞断层图中可视化此类结构还将改进定位和随后的数十万个类似结构副本的子断层图平均,从而导致细胞复合物在其原生细胞环境中的原位原子分辨率结构。

论文链接:https://www.nature.com/articles/s41467-022-33957-8

相关报道:https://techxplore.com/news/2022-11-software-package-isotropic-reconstruction-electron.html

来源:ScienceAI

声明:本站部分文章及图片转载于互联网,内容版权归原作者所有,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年11月1日
下一篇 2022年11月1日

相关推荐