一种基于mRNA的新型狂犬病病毒多表位疫苗:通过反向疫苗学和免疫信息学进行计算机设计

Contents

This entry is part 147 of 147 in the series 狂犬病疫苗

A novel mRNA-based multi-epitope vaccine for rabies virus computationally designed via reverse vaccinology and immunoinformatics

PMCID:PMC12365161 PMID:40830404

摘要

本研究借助生物信息学工具和反向疫苗学技术,基于病毒蛋白质组,研发了一种抗狂犬病病毒的多表位mRNA疫苗。本研究旨在通过诱导强烈且持久的体液和细胞免疫应答,解决现有狂犬病疫苗的局限性。从四个排名靠前的疫苗靶标(核蛋白、磷蛋白、基质蛋白和糖蛋白)中筛选并优先确定了细胞毒性T淋巴细胞(CTL)、辅助性T淋巴细胞(HTL)和线性B细胞表位(LBL),这些靶标具有高抗原性、无过敏性、无毒性且非人类同源性。所选表位与高频HLA等位基因具有强结合亲和力,高负ΔG值和低解离常数证明了这一点,预示着其能被T细胞有效识别且人群覆盖率广(全球达96.01%)。研究设计了一个包含21个入围表位(4个CTL表位、4个HTL表位和13个LBL表位)的单一mRNA构建体,并加入了适当的连接子和具有免疫刺激作用的50S核糖体蛋白L7/L12佐剂。理化分析显示,该构建体具有稳定、可溶和疏水的特性,拉氏构象图评分总体为93.2%,ERRAT质量因子为94.724%,Z评分为-5.39。此外,分子对接和简正模式分析表明,疫苗构建体与TLR-4复合物具有强结合亲和力,最低能量为-1655.0 kcal/mol,且通过23个氢键和2个盐桥相互作用维持稳定,表明其具有显著的结构稳定性和刚性。通过200纳秒的分子动力学模拟验证了该复合物的结构完整性和稳定相互作用,稳定的均方根偏差(RMSD)和回转半径值、均方根波动(RMSF)的最小波动、一致的溶剂可及表面积(SASA)以及主成分分析(PCA)中观察到的明确构象转变均证明了这一点。计算机免疫模拟显示,该疫苗能够刺激高水平免疫球蛋白、辅助性T细胞(TH)和细胞毒性T细胞(TC)的释放,以及细胞因子的释放。它还能够产生持久的记忆细胞,诱导巨噬细胞活性,并促进自然杀伤细胞和中性粒细胞的生成。此外,进一步的验证(包括密码子优化和mRNA二级结构预测)证实了该构建体在宿主中具有稳定的结构和高水平的表达。总体而言,本研究提出了一种具有前景的多表位mRNA疫苗,作为抗狂犬病的创新治疗候选疫苗。然而,还需要通过系统的动物研究进行实验验证。

补充信息

在线版本包含补充材料,可在10.1038/s41598-025-16143-w获取。

关键词:狂犬病、基于mRNA的多表位疫苗、表位预测、免疫信息学、免疫模拟、分子动力学模拟

主题词:计算生物学与生物信息学、发育生物学、药物发现、免疫学、微生物学、结构生物学、医疗保健

引言

狂犬病是一个重大的公共卫生问题,会导致严重的痛苦、死亡和经济混乱。每年,在150多个国家,狂犬病导致约5.9万人死亡。非洲的负担最重,那里的犬狂犬病仍呈地方性或流行性,也是大多数人暴露于狂犬病的原因

这种不成比例的负担反映了兽医基础设施和公共卫生系统存在的系统性挑战,突尼斯最近的疫情系列报告就体现了这一点,该报告记录了2021年至2024年间有25人死亡。现代社会中狂犬病的持续流行凸显了采取创新预防策略的迫切需求。

这种人畜共患病由负链RNA狂犬病病毒(RV)引起,该病毒是弹状病毒科狂犬病毒属病毒4。病毒基因组编码五种蛋白质:核蛋白(N)、基质蛋白(M)、糖蛋白(G)、病毒RNA依赖的RNA聚合酶(L)及其辅助因子磷蛋白(P)。糖蛋白G是诱导保护性免疫和致病性的主要抗原,核蛋白N可激活狂犬病病毒特异性T细胞,促进中和抗体的产生及其他免疫机制的发挥。结构性M蛋白通过调节病毒复制和促进细胞间传播,在狂犬病病毒的致病过程中发挥重要作用。IFN拮抗剂P蛋白不仅对病毒复制至关重要,而且在逃避宿主先天免疫方面也不可或缺

狂犬病病毒会感染哺乳动物的中枢神经系统,导致脑炎并最终致死。狂犬病病毒的传播主要通过受感染动物的唾液,这些唾液可通过咬伤、抓伤,或接触黏膜及新鲜皮肤伤口进入人体。一旦出现狂犬病症状,该病就必然致命,这凸显了及时就医和接种疫苗以预防感染的至关重要性

世界卫生组织(WHO)和全球狂犬病控制联盟等组织参与的合作项目正在全球范围内实施,旨在到2030年消除与狂犬病相关的死亡病例。事实上,狂犬病的预防和根除需要动物卫生和人类卫生部门的协同努力,重点是控制犬类和野生动物中的狂犬病,以及为暴露人群提供及时的预防措施。狂犬病控制工作面临的一个挑战是,这种疾病会影响人类和牲畜,并且可能通过野生动物宿主的传播而再次出现15。

由于狂犬病是突尼斯政府高度关注和优先处理的事项,尤其是在上一次疫情爆发之后,一个合作框架得到了加强,旨在创造关键条件,以支持公共卫生领域的有效改善。事实上, livestock和流浪狗的疫苗接种率较低,再加上农村地区疫苗供应有限,阻碍了有效的防控工作。事实证明,通过控制狐狸数量来减少狂犬病传播的尝试适得其反,破坏了生态平衡,反而加剧了疾病的传播。

狂犬病的预防和治疗在很大程度上依赖于有效疫苗的研发。世界卫生组织(WHO)通常推荐两种主要的免疫方案,即暴露前预防(PrEP)和暴露后预防(PEP),将其作为预防人类狂犬病的关键措施。目前,安全的狂犬病细胞培养疫苗(CCV)作为一种暴露后预防手段,被广泛用于人和动物的狂犬病预防,取代了巴斯德研制的神经组织疫苗(NTV)——因其存在严重的神经副作用,以及具有毒力返强风险的减毒活疫苗和可能引发自身免疫反应的佐剂疫苗(如铝基疫苗)。尽管这些疫苗具有一定效果,但仍存在一些局限性,例如免疫反应不完全、有副作用、需要多剂接种、费用较高、疫苗供应不足以及需要冷链条件。如今,单一的疫苗接种策略可能既不有效也不可行。因此,必须采用替代方法来减少接种剂量并提高疫苗的大规模覆盖率。新一代疫苗的研发正在进行中,旨在克服这些局限性

计算免疫学和反向疫苗学领域的最新进展主要集中在利用计算机模拟和生物信息学方法设计多表位亚单位疫苗,这些进展彻底改变了抗原选择和疫苗开发策略。借助这些方法,研究人员得以精确识别出针对SARS-CoV-2、狂犬病、流感病毒、寨卡病毒、结核病、疟疾以及多种癌症(黑色素瘤、肺癌、乳腺癌)的广泛保护性表位,同时能够及早评估针对保守免疫原性位点的潜在候选疫苗。这种评估方式不仅更便捷、经济且高效,还能引发体液免疫和细胞免疫。体外和体内研究均已证实多表位疫苗的效力和预防潜力,多项相关候选疫苗已进入临床试验阶段

将病毒抗原编码到mRNA疫苗中,在亨德拉病毒(HeV)和艾滋病病毒(HIV)等传染病威胁的临床前模型中已显示出有效性。这类疫苗利用经过优化的表位,可引发强烈的细胞和体液免疫反应。随着这些进展,基于mRNA的狂犬病病毒糖蛋白G相关方法也在整合计算方法,以识别保守的免疫原性表位。尽管如此,仍有一些重大障碍需要解决:(1)需要多次加强针才能产生持久免疫力;(2)存在暂时性副作用;(3)封装和递送系统的问题;(4)需要超低温冷藏。

本研究旨在应用创新的免疫信息学方法预测共有表位,并开发用于预防性接种的广谱狂犬病疫苗候选物。

方法学

序列检索和共有序列生成

狂犬病病毒蛋白(G、P、NP、M和L)的序列从美国国家生物技术信息中心数据库(NCBI)下载,然后通过Clustal omega V1.2.4(https://www.ebi.ac.uk/jdispatcher/msa/clustalo)与参考株序列进行多序列比对。随后,通过EMBOSS Cons CLI V6.6.0工具(https://www.ebi.ac.uk/Tools/)为每种狂犬病病毒蛋白生成共有序列。这些目标序列被用作预测和表位图谱分析的参考,并通过VaxiJen v2.0服务器(http://www.ddg-pharmfac.net/vaxijen/VaxiJen/VaxiJen.html,访问时间为2024年2月17日)评估其抗原性。该服务器系统通过不依赖比对的预测方法来预测蛋白质的抗原性,临界值大于0.45。VaxiJen服务器根据氨基酸的理化性质来显示蛋白质的抗原性质。该服务器的抗原预测方法基于将蛋白质序列通过自交叉协方差(ACC)转换为具有氨基酸特征的统一向量

线性B细胞表位的预测与分析

为提高表位预测的准确性,通过多个组合服务器分别预测了亚单位疫苗候选物的线性B细胞表位。

BCPREDS服务器(http://ailab.cs.iastate.edu/bcpreds/)采用了三种已开发的方法,即AAP、BCPred和FBCPred,来预测B细胞表位。BCpred使用后续的基于核函数的支持向量机(SVM)分类器,其准确率AUC值为0.758,截断分数为0.8,用于预测线性B细胞表位。而ABCpred(http://crdd.osdd.net/raghava/abcpred/)则应用递归人工神经网络(ANN)方法对表位和非表位进行分类。其阈值设定为0.8,相应的窗口长度为16聚体。

BepiPred2.0(http://services.healthtech.dtu.dk/service.php?BepiPred-2.0)采用随机森林算法,该算法基于从抗体-抗原蛋白质结构中注释的表位进行训练。BepiPred-2.0利用基于序列的表位预测方法,既对来自3D结构的表位数据进行预测,也对从IEDB数据库下载的大量线性表位集合进行预测。BcePred(http://crdd.osdd.net/raghava/bcepred/)以蛋白质的一级序列作为输入,根据氨基酸的物理化学性质(如亲水性>1.9、灵活性>2.0、可及性极性>1.8)以及暴露表面来预测B细胞表位

Epitope 1D(http://biosig.lab.uq.edu.au/epitope1d/)采用随机森林算法,同时利用基于图的蛋白质序列特征表示,并整合了生物本体论信息

所有工具均设置了默认参数,选择至少三个软件程序预测的顶级表位中部分或完全重叠的序列作为B细胞优势表位。使用计算工具评估B细胞表位的抗原性、过敏原性、毒性和免疫原性。使用VaxiJen v2.0预测抗原性,而AllerTop v2.0(http://www.ddg-pharmfac.net/AllerTOP)通过将蛋白质序列转换为固定长度的统一氨基酸组成(ACC)向量来评估过敏原性,并采用-0.4作为特异性阈值

ToxinPred(http://webs.iiitd.edu.in/raghava/toxinpred)通过针对1805种毒性肽的数据集分析理化性质来确定毒性。最后,IEDB的免疫原性工具(http://tools.iedb.org/immunogenicity/)基于理化特征(包括侧链组成和氨基酸定位)预测免疫原性潜力

细胞毒性CD8+T淋巴细胞(CTL)表位预测

NetCTL1.2服务器(http://www.cbs.dtu.dk/services/NetCTL/用于预测G、P、N和M RV蛋白的9聚体长度CTL表位。针对1类12种MHC超型(A2、A3、A24、A26、B7、B8、B27、B39、B44、B58和B62)设定的阈值为0.75。该服务器采用默认值预测这些CTL表位,涉及三个特征的组合:TAP转运效率=0.15、C端切割=0.05以及MHC-I结合肽。

人工神经网络(ANNs)被用于预测主要组织相容性复合体(MHC)I类分子的结合以及蛋白酶体C端切割,而权重矩阵则被用于计算TAP转运蛋白的效能。神经网络预测MHC/肽结合的输出是一个与纳摩尔(nM)单位的IC50值相关的对数转换值。经确认与≥4种人类白细胞抗原(HLA)I类超型存在相互作用的表位会进行下游研究。

通过免疫表位共识(IEDB)(http://tools.iedb.org/mhci/方法进一步检测已识别的表位。在完整的HLA参考集中,百分位排名<0.2且IC50值<50 nM的肽段被视为强结合剂。

然后对预测出的细胞毒性T淋巴细胞表位进行了抗原性、致敏性和免疫原性筛选。只有那些在免疫原性方面显示出正值的表位被保留下来,用于下一阶段的评估。

辅助性T淋巴细胞表位预测

NetMHCIIpan–4.0(http://services.healthtech.dtu.dk/service.php?NetMHCIIpan-4.0)用于通过人工神经网络预测15聚体长度的肽与任何已知序列的MHC-II分子的结合情况。在所有人群中最常见的HLA参考组分子DRB1∗01:01、DRB1∗03:01、DRB1∗04:01、DRB1∗07:01、DRB1∗08:01、DRB1∗11:01、DRB1∗13:01和DRB1∗15:01被选用于表位筛选。使用IEDB SMM方法对预测的表位进行排名,将IC50的临界值设为500 nM。根据抗原性、非过敏性、无毒性和免疫原性,对与≥3种超型等位基因相互作用的入围表位进行评估。

CTL和HTL表位与MHC等位基因之间的肽-蛋白对接

GalaxyWEB(https://galaxy.seoklab.org/)上提供的PepDock(https://galaxy.seoklab.org/cgi-bin/submit.cgi?type=PEPDOCK被用于CTL和HTL表位与其相关MHC等位基因的分子对接,以确定它们在细胞表面呈递以供T细胞识别的可能性。HLA等位基因的PDB结构,如HLA-A*01:01(PDB: 6MPP)、HLA-A*02:01(PDB: 2GIT)、HLA-A*02:06(PDB: 3OXR)、HLA-A*08:01(PDB: 7NVI)、HLA-B*15:01(PDB: 8ELG)、HLA-B*35:01(PDB: 4LNR)、HLA-DRB1*01:01(PDB: 5V4N)、HLA-DRB1*04:01(PDB: 5LAX)、HLA-DRB1*11:01(PDB: 6CPL)和HLA-DRB1*15:01(PDB: 5ELH),均从RCSB蛋白质数据库服务器(https://www.rcsb.org/)检索获得。使用ChimeraX v1.8去除了所有额外的肽、离子、水和配体。最后,利用HADDOCK服务器的蛋白质结合能预测工具PRODIGY(https://wenmr.science.uu.nl/prodigy/计算表位与等位基因之间的对接分数。该服务器包含以下计算参数:室温下复合物的结合亲和力(ΔG)和解离常数(Kd)。

人群覆盖率分析

将具有各自HLA等位基因的T细胞表位提交至IEDB人群覆盖率分析工具(http://tools.iedb.org/population/),以计算其在全球人群中的覆盖率。该工具用于根据HLA基因型频率以及与MHC结合或T细胞限制相关的数据,估算可能对特定表位集产生反应的个体比例

非人类同源表位筛选

为避免自身免疫的发生并筛选非人类同源表位,使用了BLASTp(https://blast.ncbi.nlm.nih.gov/Blast.cgiPAGE=Proteins)。选择在E值纳入阈值0.005以下无匹配项且一致性低于35%的表位作为非宿主/非同源蛋白。

多表位mRNA疫苗构建体设计

最终选定的LBL、HTL、CTL和表位通过KK、GPGPG和AAY连接子连接,以设计疫苗构建体。为了制造高效疫苗并增强免疫反应,具有强效TLR4激动剂作用的50S核糖体蛋白L7/L12佐剂序列被依次添加到入围的表位中。此外,在N端添加了组织型纤溶酶原激活剂(tPA)分泌信号序列(tPA),以帮助将疫苗转运出细胞;在C端添加了MHC I靶向结构域(MITD),用于将CTL表位引导至内质网的MHC-I区室。

mRNA疫苗构建体中还添加了5′端帽、Kozak序列、120-150个碱基的多聚(A)尾,以及3′和5′非翻译区(UTRs),这些对翻译和稳定性至关重要。

疫苗构建体的抗原性、免疫原性、变应原性和毒性预测

如前所述,通过在线服务器评估了所设计的mRNA候选疫苗的抗原性、过敏原性、毒性和免疫原性。

疫苗构建体的理化特性

通过ExPASy ProtParam服务器(http://us.expasy.org/tools/protparam.htm计算了该疫苗构建体的理化参数,包括理论等电点、分子量、正负残基总数、消光系数、不稳定性指数、脂肪族指数和总平均亲水性。

蛋白质溶解度预测

SOLpro服务器(http://scratch.proteomics.ics.uci.edu)用于预测疫苗构建体的溶解度。SOLpro通过基于一级序列多种表征的两阶段支持向量机(SVM)架构,预测蛋白质在大肠杆菌(Escherichia coli)中过表达时的可溶性倾向

二级结构预测

通过PSIPRED(4.0版本)(http://bioinf.cs.ucl.ac.uk/psipred/)预测了整个疫苗构建体的二级结构。PSIPRED是一种简单且准确的二级结构预测方法,它整合了两个前馈神经网络,对从PSI-BLAST(位置特异性迭代BLAST)获得的输出进行分析。溶剂可及性(ACC)和无序区域(DISO)由RaptorX Property服务器预测

3D结构建模与优化

疫苗亚单位的三级结构通过transform restrained trRosetta服务器(https://yanglab.nankai.edu.cn/trRosetta/预测。这个基于网络的平台结合了深度学习和Rosetta,以实现快速且准确的蛋白质结构预测。通过采用受约束的Rosetta和直接能量最小化,以及深度神经网络的应用,成功构建了蛋白质结构,同时确定了残基的位置和方向。

为了提高从Rosetta服务器获得的3D模型的质量,使用了3Drefine网络服务器(http://sysbio.rnet.missouri.edu/3Drefine/。该优化协议基于两步流程:优化氢键网络和原子级能量最小化。因此,通过GDT-HA、GTD-TS、MolProbity、冲突和RMSD分数评估了改进后模型的质量。

疫苗三维结构验证

通过拉氏图以及从PROCHECK(http://saves.mbi.ucla.edu/)和ProSA(http://prosa.services.came.sbg.ac.at/prosa.php)服务器获得的Z分数,对优化后的3D结构模型可能存在的结构错误进行了验证。ERRAT用于检查非键合原子相互作用。

不连续(构象型)B细胞表位筛选

肽疫苗模型的精细化3D结构已提交至IEDB Ellipro工具(http://tools.iedb.org/ellipro/),以识别构象B细胞表位。ElliPro会基于相邻残基、形状(椭球体)估计和突出指数参数,为每个输出的表位打分

多表位亚单位疫苗与 toll 样受体(TLR4)的分子对接

使用ClusPro 2.0蛋白质-蛋白质对接在线服务器(http://cluspro.bu.edu/执行对接,以确定疫苗构建体与目标免疫细胞受体的结合亲和力。TLR4(PDB 3FXI)的三维结构从RCSB蛋白质数据库(RCSB PDB)(https://www.rcsb.org/)获取。该服务器通过运行PIPER对接程序进行刚体对接,能够基于不同的评分方案生成不同的模型。肽的结构通过PyMOL进行可视化。具有最大簇大小和高结合亲和力(最低能量结构)的对接复合物进一步进行分子动力学模拟。

最后,使用PDBsum对复合物中的蛋白质-蛋白质相互作用进行了详细分析。通过PRODIGY探究了对接复合物的结合强度。

疫苗-TLR4复合物分子动力学(MD)模拟

为了评估对接的TLR4-疫苗复合物的动态行为和稳定性,使用GROMACS 2023.1进行了明确的全原子分子动力学模拟(MDS),该软件编译时支持CUDA以利用GPU加速。模拟在突尼斯巴斯德研究所的高性能计算集群(称为omics)上运行,该集群配备了NVIDIA GPU和200个CPU核心,能够实现高效的并行计算

复合物的初始3D结构首先使用pdb2gmx模块结合CHARMM36力场进行处理,选择适合生理条件的质子化状态,并采用SPC/E水模型进行溶剂化。处理后的结构被置于立方模拟盒中心,与盒壁保持1.0 nm的间距,随后使用预定义的spc216水构型进行溶剂化。为了中和系统并模拟生理离子条件,使用genion工具通过替换溶剂分子添加了钠离子(Na+)和氯离子(Cl-)。采用最陡下降算法进行能量最小化,以消除空间位阻冲突并松弛系统。最小化后的结构随后经历两步平衡过程:首先在恒定体积和温度(NVT系综)下,然后在恒定压力和温度(NPT系综)下,每步均持续100 ps,同时约束重原子。生产分子动力学模拟在NPT系综中进行,总时长为200 ns,时间步长为2 fs,使用50个MPI线程,每个MPI进程配备4个OpenMP线程,并通过CUDA利用GPU加速。静电作用采用粒子网格埃瓦尔德(PME)方法处理,所有键长均使用LINCS算法约束以确保数值稳定性。轨迹文件每10 ps保存一次。模拟后分析用于评估系统稳定性和构象变化:计算主链原子(Cα)的均方根偏差(RMSD)以评估随时间的结构漂移;从能量曲线中提取平均温度以确保热稳定性;量化整个轨迹中主链原子间的氢键以评估分子内和分子间的内聚力;每10 ns提取代表性结构快照,以可视化复合物随时间变化的演变。这一全面的方案确保了在明确溶剂条件下,对蛋白质-疫苗相互作用在较长时间尺度上的准确建模。

TLR4-疫苗复合物的正常模式分析(NMA)

通过iMODS服务器(http://imods.chaconlab.org/对TLR4疫苗结构进行了正常模式分析(NMA),以通过结构变形分析、相互作用残基的特征值(使结构变形所需的能量)、B因子值评分(迁移率分布)、单个残基间的协方差图以及弹性网络模型来研究疫苗-TLR4复合物的结构动力学和灵活性。基本界面与用于粗粒度模型原子表征的CA选项一起使用。

计算机免疫模拟

C-IMMSIM服务器(https://kraken.iac.rm.cnr.it/C-IMMSIM/(访问时间为2024年8月17日)被用于进行计算机免疫模拟,以阐明其触发宿主免疫系统对所设计肽疫苗产生反应的潜力。该服务器同时模拟哺乳动物免疫细胞的三个部分——骨髓、胸腺和淋巴结,并利用从机器学习技术中得出的位置特异性评分矩阵(PSSMs)来预测免疫相互作用。

每四周注射一次,共三剂,每剂含有1000个抗原蛋白且不含脂多糖(LPS),所有模拟参数均设为默认值,时间步长分别设为1、84和168个模拟步。一个时间步相当于日常生活中的8小时,第一剂在时间=0时注射。免疫模拟的输入参数包括10微升的标准体积、12345个随机种子和1050个模拟步。

mRNA疫苗的密码子优化与二级结构预测

通过GenScript(http://www.genscript.com/tools/gensmart-codon-optimization)(访问日期:2024年8月17日)对疫苗构建体的密码子进行优化,以优化该疫苗在人类宿主中的密码子使用情况。利用GenScript稀有密码子分析工具(http://www.genscript.com/tools/rare-codon-analysis)测定优化后DNA序列的GC含量、密码子适应指数(CAI)和密码子频率分布(CFD)。在宿主中实现充分表达的理想GC含量百分比范围为30%至70%。CAI是衡量目标序列同义密码子使用偏好的指标,其范围为0至1,数值高于临界值(>0.8)表明相关基因更有可能高效表达。密码子频率分布(CFD)用于表示异常串联密码子的出现情况。随后,通过翻译工具将优化后的DNA序列转换为RNA序列,并借助RNAFold网络服务器(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi进行二级结构预测,以开展热力学分析并获取最小自由能评分。

结果

图1展示了一个流程图,该图以图形化的方式概述了用于设计抗狂犬病病毒(RV)mRNA疫苗的方法。

蛋白质组筛选和蛋白质优先级排序

从NCBI获取狂犬病病毒(RV)的G、P、NP、M和L蛋白的可用序列,并进行多序列比对。EMBOSS软件为每种蛋白生成一个共有序列,然后结合巴斯德株的相应参考序列对保守性进行分析。

结果显示,这五种蛋白质中有四种(G、P、N和M)具有抗原性(表1)。

表1.共有序列与其各自参考序列的保守性分析及抗原性评估。

蛋白质下载的序列数量蛋白质数据库共有序列错配共有序列缺口共识保守性(%)(截断值 0.4)
与参考菌株
核蛋白(NP)

P06025

NCAP_RABVP

磷蛋白(P)P06747·PHOSP_RABVP
基质(M)P08671·MATRX_RABVP
糖蛋白(G)

P08667

GLYCO_RABVP

大蛋白(L)

P11213

L_RABVP

这些抗原被选为疫苗靶点,用于针对狂犬病病毒(RV)的mRNA疫苗开发的计算机模拟分析。

线性B细胞表位预测

使用ABCPred、BCEpred、BCPREDS、Bepipred和epitope 1D服务器进行线性B细胞预测(图2,表S1)。保留至少在三个高分服务器中重叠且满足抗原性、毒性、过敏性和免疫原性标准的预测表位,用于最终疫苗构建。所有测试的蛋白质组分共预测出13个表位(表2)。

图2.

Fig. 2

不同服务器工具的B细胞表位图谱结果。黑色方块代表BCPREDS预测的表位,红色方块代表ABCPred预测的表位,绿色方框代表BCEpred预测的表位,虚线方块代表Bepipred预测的表位,紫色方块代表1Depitope预测的表位。两端带有数字的黑线代表本研究中使用的共有生成序列的长度。

表2.狂犬病病毒N、P、M和G蛋白的预测B细胞表位。

蛋白质肽序列(VaxiJen评分)致敏性毒性免疫原性人类同源性
N89WTSYGIL 95

抗原

非过敏原无毒非人同源性
115DVEGNWALTGGMELTR130

抗原

非过敏原无毒非人同源性
153ISGQNTGNYKTN164

抗原

非过敏原无毒非人同源性
369YEAAELTKTDVALADD384

抗原

非过敏原无毒非人同源性
P35NQAHLQGEPIEV46

抗原

非过敏原无毒非人同源性
103QIVRQIRSGE112

抗原

非过敏原无毒非人同源性
186WSATNEE 192

抗原

非过敏原无毒非人同源性
M128RGPLEGEELEYSQE141

抗原

非过敏原无毒非人同源性
161QGRIWCINMNSR172

抗原

非过敏原无毒非人同源性
G27PDKLGPWSPIDIHHLSCPNNLVVED51

抗原

非过敏原无毒非人同源性
96YVTTTFKRKHFRPTPDAC113

抗原

非过敏原无毒非人同源性
116AYNWKMAGDPRYEESLHNPYPDYH141

抗原

非过敏原无毒非人同源性
281DFRSDEIEHLVVEELVKKREE 301

抗原

非过敏原无毒非人同源性

图1.

Fig. 1

本研究中用于狂犬病mRNA多表位疫苗计算机设计的工作流程和工具。

细胞毒性T淋巴细胞(CTL)表位预测

在选定的四种狂犬病病毒(RV)蛋白中,共有13个长度为9个氨基酸的细胞毒性T淋巴细胞(CTL)表位与至少四种主要组织相容性复合体(MHC)I类超型表现出强结合力(表S2)。随后,对这些表位的抗原性、免疫原性、非过敏性和无毒性进行了评估。最终,有4个表位(1个来自N蛋白,2个来自G蛋白,1个来自M蛋白)被预测为具有抗原性、免疫原性、非过敏性、无毒性的CTL表位(表3)。随后,通过联合方法确认了免疫表位数据库(IEDB)服务器,其中所选表位被认定为有效的CTL表位。

表3.用于多表位疫苗构建的细胞毒性T淋巴细胞(CTL)表位候选清单。

蛋白质表位超级型MHC I类等位基因结合语境,“Binding score” 翻译为:结合分数半数抑制浓度免疫原性评分瓦希仁致敏性毒性人类同源性
N251LTAREAILY259A1,A3, A26,B7, B58, B62

HLA-A*01:01

A*30:02

B*57:01

B*58:01

A*11:01

B*35:01

A*68:01

抗原(0.4956)非过敏原无毒非人同源性
M114YKLRRTLIF122A23、B8、B27、B39、B62

HLA-B*08:01

A*23:01

抗原(0.4836)非过敏原
G8FVPLLVFSL16A2、A24、A26、B8

HLA-A*02:06

A*68:02

A*02:01

A*02:03

抗原 (0.5224)非过敏原
93FVGYVTTTF101A24,B7, B58,B62

HLA-B*35:01

A*23:01

B*53:01

B*15:01

B*58:01

A*32:01

抗原 (0.7884)非过敏原

辅助性T淋巴细胞(HTL)表位预测

根据NetMHCIIpan 4.0版本的预测结果,在抗原蛋白中总共鉴定出14个MHC-II表位(15聚体),它们与至少3种独特的HLA DRB等位基因具有结合亲和力(表S3)。经过对强结合亲和力、抗原性、非致敏性和无毒性的全面评估,最终选择了G蛋白的2个表位,以及NP蛋白和M蛋白各1个表位用于疫苗设计(表4)。这些HLA表位中的大多数都显示出能够诱导干扰素-γ(IFN-γ)和白细胞介素-10(IL-10)等细胞因子的能力。

表4.用于多表位疫苗构建的选定辅助性T淋巴细胞(HTL)表位。

蛋白质HTL表位(临界值 = 0.4)致敏性毒性HLA等位基因数量HLA等位基因/半最大抑制浓度值(纳摩尔)INF-γIL-4IL-10同源性
N421RRYVSVSSNHQARPN

抗原

非过敏原无毒

DRB1*0101/(46.00)

DRB1*0401/(12.40)

DRB1*0701/(82.80)

DRB1*1101/(33.30)

DRB1*1301/(199.30)

阳性非诱导剂阴性非人同源性
M145DDTEFVGLQIRVSAR

抗原

非过敏原无毒

DRB1*0101/(14.00)

DRB1*1101/(40.20)

DRB1*0701/(300.90)

DRB1*0401/(342.20)

DRB1*0801/(214.40)

DRB1*1301/(85.00)

阴性非诱导剂阳性非人同源性
G63ELKVGYISAIKVNGF77

抗原

非过敏原无毒

DRB1*0101/(5.80)

DRB1*1501/(39.30)

DRB1*1101/(33.00)

DRB1*0701/(51.50)

DRB1*0401/(302.70)

DRB1*0801/(263.70)

DRB1*1301/(149.70)

阳性
148KESLVIISPSVADLD162

抗原

非过敏原无毒

DRB1*0101/(31.30)

DRB1*1501/(153.00)

DRB1*0701/(251.50)

DRB1*0801/(403.60)

阳性

磷蛋白

CTL和HTL表位与HLA等位基因的分子对接

我们使用GalaxyPepDock服务器对CTL和HTL表位与其相关的MHC等位基因进行分子对接,结果显示这些表位与其各自的HLA等位基因之间存在强烈的结合相互作用和热力学稳定性,这体现在负的吉布斯自由能值(ΔG <−7.6千卡·摩尔⁻¹,平均值=−17.5)和较低的解离常数上。图3显示,表位对接在其相应HLA等位基因的结合槽内。

图3.

Fig. 3

Fig. 3

N蛋白表位(NPE)、M蛋白表位(MPE)和G蛋白表位(GPE)与各自HLA等位基因的分子对接。针对每种蛋白,确定了最具代表性的表位,并展示了它们与具有最高亲和力的等位基因的结合情况。蛋白质-肽的对接使用GalaxyPepDock服务器进行。每种结合的自由能(ΔG)值显示了表位与等位基因之间的亲和力,该值通过PRODIGY服务器确定。 ribbon结构展示HLA等位基因,而棍状结构展示相应的表位。

人群覆盖率分析

入围的MHC-I和MHC-II表位在全球范围内的综合人群覆盖率达到96.01%(图3),pc90平均值为1.5,每个HLA抗原的平均命中数为4.08。欧洲和北美的覆盖率最高,分别为98.42%和97.62%,其次是北非,为92.54%(图3)。在被确定为狂犬病影响最严重的非洲地区中,几内亚比绍、佛得角、摩洛哥、突尼斯和津巴布韦的选定表位人群覆盖率超过90%。此外,苏丹、喀麦隆、塞内加尔、南非、乌干达和赞比亚的人群覆盖率超过80%(图4和图S1)。

图4.

疫苗构建体中所选T淋巴细胞表位的IEDB全球人群覆盖度分析。

多表位mRNA候选疫苗序列的构建

我们mRNA疫苗的最终构建体是从N端到C端设计的,如图5所示。

图5.

Fig. 5

设计的基于mRNA的多表位构建体的示意图。CTL:细胞毒性T细胞,HTL:辅助性T细胞,HTL:辅助性T细胞,tPa:组织型纤溶酶原激活剂,MITD:MCH I-转运结构域。

疫苗的编码区由三组具有抗原性、无毒性且无致敏性的CTL、HTL和B细胞候选表位组成,这些表位分别通过AAY、GPGPG和KK连接子依次连接。为增强免疫应答,通过GPGPG连接子添加了佐剂50核糖体蛋白L7/L12。关键的mRNA元件,包括5′m7G帽结构序列、包含AUG密码子的Kozak序列、位于mRNA开放阅读框(ORF)两侧的珠蛋白5′和3′非翻译区(UTRs)以及120-150个碱基的多聚(A)尾,均已整合到疫苗中,以提高翻译效率。此外,为促进翻译后表位的释放,通过GPGPG连接子在N端添加了组织型纤溶酶原激活剂(tPA)分泌信号序列(tPA)。另外,在C端通过EAAK连接子连接了一个MHC I靶向结构域(MITD),以引导CTL表位进入内质网的MHC-I区室。

抗原性、过敏性、毒性和免疫原性的评估

进一步分析发现,该嵌合构建体具有抗原性,VaxiJen v2.0和ANTIGENpro服务器预测的概率得分分别为0.6006和0.869。此外,该多表位疫苗还被检测为非过敏原、无毒、可溶(0.828496)且具有免疫原性(0.29221)。

二级结构预测

通过Garnier-Robson方法预测,最终疫苗的二级结构包含32%的α螺旋、14%的延伸链和53%的卷曲。RaptorX Property服务器预测的溶剂可及性(ACC)显示,56%的残基被预测为暴露状态,21%为中等暴露状态,21%为埋藏暴露状态。只有11%的残基被预测位于无序区域(DISO)。RV的二级结构如图6所示。

图6.

Fig. 6

Fig. 6

通过位置特异性迭代预测(PSIPRED)服务器对疫苗构建体进行二级结构预测。

理化性质分析

理化性质分析结果如表5所示。设计的构建体分子量约为52.10 kDa(小于110 kDa),由72个带正电荷的残基和70个带负电荷的残基组成。等电点值为8.13(碱性)。此外,用于预测过表达时溶解度的SOLpro服务器显示出良好的预测值(0.88)。不稳定指数经计算为32.76,表明该蛋白质为稳定蛋白。该构建体的脂肪族指数、GRAVY(平均亲水性)和在280 nm处的消光系数分别为81.98、-0.430和58,455 M⁻¹ cm⁻¹。

表5.构建体的抗原性、过敏性和理化特性。

特性计算值备注
氨基酸数量适宜的
分子量适宜的
理论等电点基本
化学式C2343H3719N629O697S8
extinction系数(在H2O中,280 nm处)
疫苗不稳定指数稳定的
疫苗的脂肪族指数耐热的
平均亲水性(GRAVY)−0.430亲水的
抗原性

0.6006(Vaxijen v2.0)

0.910541(抗原)

抗原性的

抗原性的

致敏性

非过敏原(AllerTOP)

非过敏原(AllergenFP)

非过敏原

非过敏原

溶解度0.888624(SOLpro)可溶的

三级结构建模与优化

通过trRosetta服务器成功模拟出了所设计的多表位疫苗的5种三级结构。预估的TM评分有助于了解两种结构之间的相似性,其值范围为0到1。TM评分高于-0.5表明拓扑结构正确,而评分低于-0.17则意味着存在随机相似性。所选模型的预估TM评分为-0.331。

优化结果以3Drefine分数呈现。保留的模型整体质量优异,全局距离测试高精度(GDT-HA)达到0.9686([0,1]范围内的分数表明与初始模型的分数相近),RMSD为0.366埃,即优化模型相对于初始模型的Cα原子的均方根偏差分数(Cα-RMSD),molProbity值较低,为1.277,冲突分数为5.2,旋转异构体分数不佳,为0.0。图7A和B展示了保留的优化模型及其序列。

图7.

Fig. 7

多表位疫苗序列结构预测与验证。(A)多表位疫苗的序列排列(佐剂、EAAK、AAY、GPGPG、KK和表位,分别用蓝色、橙色、红色、棕色、绿色和黑色标记)。(B)经优化的构建体的三级结构,显示α-螺旋、β-链和无规卷曲。(C)ProsA Z值(-5.39)表明该模型质量接近通过X射线晶体学确定的蛋白质结构;因此,经正向优化的(D)ERRAT图得分为94.72。(E)优化模型的拉氏图显示,93.2%的残基位于最有利区域(红色),5.4%位于有利区域(黄色),0.7%位于宽松允许区域(浅黄色),0.7%位于不允许区域(白色)。

疫苗三维结构验证

通过ProSA-web、RAMPAGE和ERRAT服务器对优化后的三级结构进行了验证。优化后的模型显示,93.2%、5.4%、0.7%和0.7%的残基分别位于最有利区域、有利区域、允许区域、宽松允许区域和异常区域(图7C)。此外,ProSA的Z评分为-5.39(图7D),处于可接受的评分范围内。经ERRAT分析,局部模型质量为94.72(图7E)。所有这些结果表明,该构建体的预测结构是合理且可靠的。

构象B细胞表位的筛选

使用ElliPro预测经过验证的不连续(构象)B细胞表位的3D结构。总共有8个BCL构象表位涉及242个残基,得分范围为0.529至0.871(图8和表S4)。

图8.

Fig. 8

通过IEDB服务器的ElliPro工具预测的候选疫苗中的构象B细胞表位。黄色球体代表构象B细胞表位。(A)43个残基(氨基酸1-43),得分0.871。(B)69个残基(氨基酸382-450),得分0.845。(C)16个残基(氨基酸251-266),得分0.669。(D)14个残基(178-191),得分0.663。(E)52个残基(氨基酸269-320),得分0.657。(F)6个残基(氨基酸376-381),得分0.638。(G)36个残基(氨基酸72-129),得分0.583。(H)5个残基(氨基酸192-196),得分0.529。

疫苗蛋白与TLR4的分子对接

疫苗构建体与TLR4之间的分子对接通过ClusPro 2.0服务器完成,该服务器生成了10个对接复合物,并按能量和簇成员进行排名(表S5)。簇7的能量得分最低,为-1600.5千卡/摩尔,有21个簇成员,被选为最佳复合物(图9A)。

图9.

Fig. 9

疫苗构建体与TLR4的分子对接。(A)疫苗(A链)和TLR4(B链)的对接复合物。疫苗(配体)以青色显示,TLR4的B链(受体)以绿色显示。(B)通过PDBsum分析获得的对接疫苗(A链)与TLR4受体(B链)之间的氨基酸相互作用。参与疏水相互作用的残基以红色虚线显示,参与氢键作用的残基以绿色虚线显示。(C)通过Pymol可视化的疫苗构建体(A链)和受体(B链)的相互作用残基。

PDBsum相互作用分析显示,TLR4的B链与疫苗(A链)之间存在23个氢键和2个盐桥,同时还有302个非键接触(图9B)。

参与氢键形成的氨基酸及其键长列于表S6中。

使用PRODIGY网络服务器进行的高级分析对对接蛋白的吉布斯自由能(ΔG)和解离常数进行了评估,结果表明TLR4疫苗复合物在能量上是可行的,其ΔG值为-18.4千卡/摩尔(负值),解离常数较低,为3.4e-14。

分子动力学模拟

为了评估TLR4-疫苗复合物在分子动力学模拟过程中的整体结构稳定性,我们计算了200纳秒(ns)内主链原子的均方根偏差(RMSD)。如图10A和补充图S2所示,RMSD曲线呈现出以下特征。初始上升阶段(0-50 ns):RMSD从约0.3 nm急剧上升至约2.5 nm,表明对接过程中施加的初始结构约束迅速松弛。该阶段通常对应于平衡和早期构象调整。中间波动阶段(50-150 ns):RMSD值在1.5 nm至3.5 nm之间波动,表明复合物具有构象灵活性。这一动态区域可能涉及环运动或结构域重排,这在TLR4等免疫受体中较为常见。稳定阶段(150 ns后):从约150 ns开始,RMSD值稳定在3.2-3.4 nm左右,表明系统达到了相对稳定的构象状态或局部能量最小值。这种稳定状态反映了模拟的收敛性,并为进一步的结构和能量分析提供了可靠的采样构象。较高的RMSD幅度(>2.0 nm)表明该复合物具有显著的结构可塑性,这可能与受体识别或信号转导的生物学过程相关。尽管存在这些波动,系统仍表现出逐步稳定的趋势,这是成功的长时间尺度分子动力学模拟的标志。

图10.

Fig. 10

TLR4-疫苗复合物的200纳秒分子动力学模拟分析。该图展示了TLR4-疫苗复合物的动态和结构行为:(A)均方根偏差(RMSD)显示初始上升至约0.15纳米,随后出现适度波动并稳定在0.10-0.125纳米之间,表明结构收敛。(B)均方根波动(RMSF)突出显示了残基190、300和340附近的柔性区域,而大多数残基保持稳定(0.04-0.11纳米),反映出有限的局部流动性。(C)回转半径(Rg)从约6.0纳米降至4.25纳米以下,表明复合物逐渐压缩。(D)溶剂可及表面积(SASA)在初始峰值后稳定在614-634纳米²之间,表明溶剂暴露和结构折叠保持一致。(E)分子间氢键(F)基于主成分分析(PCA)的TLR4-疫苗复合物构象图谱,该图谱来源于TLR4-疫苗复合物的200纳秒分子动力学模拟,将系统的构象状态映射到前两个主成分(PC1和PC2)上,这两个主成分代表了主要运动和能量上有利的构象状态。

这种RMSD趋势强化了对接构象的质量,并证实TLR4-疫苗相互作用在200纳秒内保持结构稳定,为包括结合自由能计算、氢键稳定性和基本动力学在内的下游分析提供了可靠基础。

为了进一步验证在全局均方根偏差(RMSD)分析中观察到的TLR4-疫苗复合物的结构稳定性,我们对受体与疫苗构建体之间的相互作用界面进行了重点评估。如图10A和B所示,我们专门针对参与结合的界面残基计算了均方根偏差(RMSD)和均方根波动(RMSF)。在200纳秒的模拟过程中,界面的RMSD始终保持在较低水平(约0.12–0.15纳米),表明相互作用稳定,偏差极小。RMSF图谱显示蛋白质整体具有中等灵活性,数值范围在0.04至0.14纳米之间。在残基190(约0.14纳米)、300(约0.135纳米)和340(约0.145纳米)附近观察到较高的波动,这些位置对应于环区或末端区域。大多数残基的波动范围在0.04–0.11纳米内,表明局部灵活性有限,核心区域稳定。

此外,图10C和D分别展示了整个复合物的回转半径(Rg)和溶剂可及表面积(SASA)。回转半径(Rg)起始于约6.0纳米,并在25,000皮秒时稳步下降至约5.2纳米,在整个模拟过程中观察到短暂波动。在100,000皮秒时,其值大幅下降至约4.25纳米,表明系统发生了压缩。从100,000皮秒到150,000皮秒,Rg值在4.25纳米至4.5纳米之间略有波动,并且在模拟结束时降至4.25纳米以下,这表明 compactness有所增加。

溶剂可及表面积(SASA)从约637 nm²稳步下降至约620 nm²,表明其与溶剂的接触减少,这可能是由于三级结构的稳定和结合界面的维持。总之,这些结构描述符为TLR4-疫苗复合物在整体和分子界面上的构象稳定性及紧凑性提供了有力证据,支持其适用于结合自由能和基本动力学等下游分析。主成分分析(PCA)热图补充了自由能景观,突显了TLR4-疫苗复合物如何逐步稳定为窄范围的低能量构象集合。主成分1(PC1)的主导地位(解释最大方差)表明存在协同的结构重排,可能与功能性运动(如结合位点调整)相关。 为捕捉分子动力学(MD)模拟过程中TLR4-疫苗复合物内的主要集体运动,进行了主成分分析(PCA)。图10F显示了模拟轨迹在PC1和PC2上的投影,这两个主成分代表了主要的构象变化。该图展示了轨迹随时间的变化过程,颜色从深红色(模拟开始)渐变至灰色(模拟结束),体现了构象空间的持续且有限的探索。轨迹中多个区域被重新访问,表明在蛋白质-疫苗界面存在稳定和半稳定的构象,且分子间相互作用持续存在。这一观察结果与分子间氢键分析所揭示的模式一致,后者显示在整个模拟过程中氢键数量保持稳定(图10E)。 该图中的模拟快照表明复合物存在稳定且频繁出现的构象状态。相反,较高能量区域对应稳定性较差的瞬时构象,这说明TLR4-疫苗复合物探索的构象空间多样但有限,与稳定的蛋白质-配体系统特征相符,也印证了从RMSD、回转半径(Rg)和氢键分析等其他分析中得出的结论,这些结论共同证实了候选疫苗与TLR4受体之间相互作用的结构稳健性和生物学有利性。密集的红色簇反映了能量上有利且频繁出现的构象盆地,支持了自由能景观(FEL)分析的结果。这些稳定状态表明复合物具有紧凑、稳健的结构行为,与RMSD、Rg、SASA和氢键分析的结果一致。 总体而言,这种动态且有限的运动强调了疫苗构建体与TLR4受体之间具有生物学相关性且持续的相互作用,增强了疫苗构建体的结构完整性。总之,这些结果表明,在200 ns的分子动力学模拟过程中,TLR4-疫苗复合物保持了较强的结构稳定性、稳定的分子间相互作用和紧凑的折叠构象。这些发现验证了候选疫苗在生理条件下有效结合受体的潜力。

疫苗TLR4复合物的NMA

为了进一步分析疫苗与TLR4的复合物,通过iMODS服务器进行了正常模式分析(NMA)。iMODS采用正常模式分析方法,利用正常模式分析(NMA)探究大分子的集体运动。结果如图11所示。

图11.

Fig. 11

对接复合物的正常模式分析。(A)正常模式分析迁移率(NMA),(B)复合物的可变形性,(C)B因子揭示复合物中NMA与PDB字段之间的关联,(D)表征结构变形所需能量的特征值,(E)与特征值成反比的方差(绿色显示累积方差,红色显示方差),(F)协方差图,其中红色表示相关运动,白色表示不相关运动,蓝色表示反相关运动,以及(G)弹性网络,其中深灰色区域表示刚度更大。

对接复合物的正态模式分析(NMA)(图11A)。复合物的可变形性基于每个残基的特定不准确性,由链铰链表示。图中的峰值与蛋白质的变形区域相关(图11B)。B因子值评分证实了NMA结果(图11C)。与每个正态模式相关的特征值代表运动刚度。其值与变形结构所需的能量直接相关。特征值越低,变形越容易。如图11D所示,复合物的特征值为1.81729e–08,表明该复合物是稳定的。图11E显示了与每个正态模式相关的方差。彩色条显示了个体方差和累积方差。方差与特征值成反比。协方差分析如图11F所示,用于描述复合物分子动态区域中相关、不相关(白色)或反相关(蓝色)的原子运动。弹性网络模型定义了通过弹簧连接的原子对。图中的每个点(图11G)代表相应原子对之间的一个弹簧。这些点根据其刚度着色;颜色越深的灰色表示弹簧越硬。综上所述,这些结果预测了RAB-VAC TLR4复合物的稳定性。

计算机模拟免疫反应

使用C-ImmSim服务器研究了所设计疫苗的有效免疫应答特征。免疫模拟分析预测会产生强烈的体液免疫应答。初次免疫应答显示出高滴度的免疫球蛋白IgM。在后续暴露后,二次和三次免疫应答更为活跃,这可通过IgG1+IgG2和IgM水平的升高(相比IgG+IgM抗体水平较低)得到证明(图12A)。检测到高滴度的(IgG、IgM、IgG1和IgG1+IgG2)抗体,导致抗原浓度降低。此外,还检测到多种模拟的B细胞同种型和记忆B细胞的产生,这表明该疫苗构建体可诱导有效的长效免疫反应,并能更有效地清除抗原(图12B和C)。辅助性T细胞(TH)和细胞毒性T细胞(TC)的数量显著增加(暴露后约50天分别达到11000个/mm³和900个/mm³),并且伴随相应的记忆细胞发育,反应显著(图12D和E)。

图12.

Fig. 12

通过C-ImmSim服务器预测的计算机免疫模拟,以评估所设计的疫苗RDV-V嵌合肽的免疫潜力。(A)疫苗注射后,免疫球蛋白抗体水平升高,抗原水平降低。(B)疫苗注射后,B细胞群水平升高,抗原水平降低。(C)反复接触抗原后,B细胞群增多。(DE)反复接触抗原后,细胞毒性T细胞和辅助性T细胞的数量增加。(F)不同类型的辅助性T细胞之间的转换。(GI)在免疫期间,树突状细胞、巨噬细胞和自然杀伤细胞的数量有所增加。(J)反复接触抗原后,细胞因子和白细胞介素的浓度升高。插图显示了危险信号以及白细胞生长因子IL-2。

Th0型免疫反应的细胞数量较低(少于20000个细胞/mm³),而Th1型免疫反应在第50天左右达到峰值,为120000个细胞/mm³(图12F)。事实上,经过一系列暴露后,Th1细胞达到了持续的显著水平(图12F)。

同时,暴露后自然杀伤细胞(NK细胞)和树突状细胞(DCs)的活性随之增强,同时巨噬细胞的增殖也得到改善(图12G、H和I),这表明其能向T细胞有效呈递抗原。在注射过程中,还可明显观察到干扰素-γ(IFN-γ)、转化生长因子-β(TGF-β)、白细胞介素-23(IL-23)、白细胞介素-10(IL-10)和白细胞介素-12(IL-12)等多种细胞因子的显著诱导(图12J)。根据免疫模拟结果,所设计的嵌合疫苗预计能引发强烈的免疫反应,并确保免疫原性和稳定性。

mRNA疫苗的密码子优化与二级结构预测

通过计算机程序对疫苗构建体的密码子使用情况进行了优化,以确保其在人类宿主中的表达效率。优化后的密码子序列长度为1788个核苷酸,CAI值为0.92(图13A)。改良构建体的平均GC含量和CFD值分别为58.33%和0%。总体而言,这些结果清楚地表明该构建体在目标表达宿主中具有高效表达的巨大潜力。

图13.

Fig. 13

通过RNAFold网络服务器对设计的mRNA疫苗构建体进行密码子优化和二级结构分析。(A)密码子适应指数(CAI)值。(B)mRNA疫苗构建体的最小自由能(MFE)结构。(C)mRNA疫苗构建体的质心自由能(CFE)。(D)MFE结构、RNA结构的热力学集合以及质心结构的山形图表示。红线、绿线和蓝线分别代表MFE结构、RNA结构的热力学集合和质心结构。(E)每个位置的 positional entropy 图。

mRNA二级结构的预测至关重要,因为它是影响翻译起始、延伸以及mRNA生物合成的关键因素。通过RNAfold在线服务获得了与整个mRNA结构相关的自由能。RNA二级结构的最小自由能为ΔG = -634.70千卡/摩尔(图13B)。质心二级结构的最小自由能为-533.34千卡/摩尔(图13C)。最小自由能结构、RNA结构的热力学集合以及质心二级结构的山形图显示出显著的重叠(图13D)。每个位置的 positional entropy 也在图13E中呈现。这些分数反映了宿主内蛋白质翻译的稳定性和效率。mRNA稳定性的增强与表达率的提高直接相关。

讨论

狂犬病是一种危及生命的疾病,没有有效的抗病毒治疗方法,且临床症状复杂。因此,疫苗是预防狂犬病最有效的措施。尽管现有狂犬病疫苗有效,但它们不能提供终身保护,需要加强剂次。采用计算方法和生物信息学工具进行抗原图谱绘制的新型疫苗接种方法具有优势且前景广阔。有趣的是,多表位疫苗通过在单一疫苗构建体中整合不同的免疫原性成分,能强烈刺激免疫系统的适应性和先天性标志物,因此可广泛用作针对多种病原体的预防和治疗措施,并能为特定人群或个体定制。

为了改进疫苗方案并增强亚单位疫苗的效力,我们设计了一种基于计算机模拟预测和模拟的生物信息学多表位mRNA候选疫苗。据我们所知,这是首次通过筛选整个狂犬病病毒蛋白质组中抗原性最强的表位来设计mRNA多表位狂犬病病毒疫苗的研究。

开发一种能够针对多种病毒株的疫苗,其关键在于比对这些病毒株不同的蛋白质序列,识别出保守序列,从而筛选出最有效的候选表位。因此,研究人员通过对不同狂犬病病毒(RV)株的G、P、NP和M四种蛋白质进行多序列比对,生成了共有序列。利用所得序列预测线性B细胞、细胞毒性T淋巴细胞(CTL)和辅助性T淋巴细胞(HTL)表位,随后根据这些表位的抗原性、免疫原性、非过敏性、无毒性和非同源性进行优先级排序,以提高其有效性、安全性和准确性。最终,筛选出具有抗原性、非同源性、免疫原性、无毒性、非过敏性,且能够诱导γ干扰素(IFNγ)和/或白细胞介素-4(IL-4)或白细胞介素-10(IL-10)产生(针对HTL表位)的B细胞、HTL和CTL表位。

分子对接评估通过测量选定表位与其各自人类白细胞抗原(HLA)等位基因的结合亲和力,确定了这些表位的免疫原性潜力。结果显示出强烈的相互作用,这体现在持续为负的吉布斯自由能ΔG变化和较低的解离常数上,这与能量上有利的结合相关联。这种强结合亲和力对于表位在细胞表面的正常展示至关重要,从而有助于细胞毒性T淋巴细胞(CTL)和辅助性T淋巴细胞(HTL)对其进行识别。

人群覆盖分析显示,疫苗构建体中包含的细胞毒性T淋巴细胞(CTL)和辅助性T淋巴细胞(HTL)表位组合覆盖了96.01%的全球人口,在历史上受疫情影响的地区覆盖度尤其高。

最终的肽疫苗构建体是通过分别使用KK、GPGPG和AAY连接子将B细胞表位、HTL表位和CTL表位连接在一起而设计的。这些连接子在蛋白质融合体的稳定性和折叠以及不同功能结构域中发挥关键作用,以避免重叠并确保有效的抗原呈递

关键成分的存在,如5’端帽子结构、编码序列两侧的5’和3’非翻译区(UTR)元件,以及翻译起始位点“Kozak序列”和含120个碱基的多聚腺苷酸尾,对mRNA的有效稳定性及其向蛋白质的翻译至关重要。此外,组织型纤溶酶原激活剂(tPA)信号序列虽会被转录但不会被翻译,它被包含在编码序列之前,供翻译机制识别。最后,还整合了主要组织相容性复合体(MHC)I类转运信号域(MITD),以提高抗原呈递效率。另外,50S核糖体蛋白L7/L12(RPLL)佐剂通过GPGPG连接子连接到构建体的N端,以延长免疫应答的持续时间。来自结核分枝杆菌(Mycobacterium tuberculosis)Rv0652的RPLL可被 toll 样受体4(TLR4)识别,诱导树突状细胞成熟和促炎细胞因子产生,并在 innate 免疫应答中发挥关键作用。结合细胞毒性T淋巴细胞(CTL)、辅助性T淋巴细胞(HTL)和线性B细胞表位,最终的狂犬病构建体长度为474个氨基酸。

对二级结构的分析显示,预测的肽主要由53%的卷曲、32%的α-螺旋和11%的无序残基组成。这些区域已被确定为重要的“结构抗原”类型

疫苗在宿主水环境中的高溶解度是成功研发的关键。这些疫苗的GRAVY值和溶解特性也表明了它们未来的应用潜力。trRosetta建模的结构被认为是令人满意的,因为它能快速且准确地预测疫苗构建体的三维结构,其中最佳模型的TM值较高;TM值越高,表明建模结构越好。该模型被提交至3Drefine进行进一步优化。根据3Drefine评分、GDT-TS、GDTHA、RMSD、MolProbity和RWPlus,生成了排名前五的最终模型。优化后的模型若具有较低的3Drefine评分、RWplus值和MolProbity值,同时具有较高的GDT-TS、GDT-HA和RMSD值,则表明其质量更优。优化模型的质量通过拉氏图、ERRAT质量因子和ProSA z评分来评估。拉氏图分析显示,93.2%的残基处于优势区域,5.4%处于允许区域,0.7%处于额外允许区域,而只有0.7%处于不允许区域,这表明侧链原子和主链原子之间的空间位阻冲突极小。同样,通过分析z评分和ERRAT质量因子来识别结构中可能存在的错误。-5.65的负z评分表明该候选疫苗的三维结构具有较高的质量和可靠性。ERRAT通过分析不同原子类型之间的非键相互作用统计数据,得出整体质量因子大于50,即86%,这表明该模型质量较高

Toll样受体(TLRs)是炎症通路的重要介质,众所周知,它们能够识别各种病原体相关分子模式(PAMPs),并在介导先天性和适应性免疫反应中发挥重要作用。有趣的是,通过在其序列中加入TLR4激动剂(50S核糖体蛋白L7/L12),我们的多表位疫苗可能会有效增强潜在的受体相互作用。因此,我们对TLR4和疫苗复合物进行了分子对接和动态模拟,以评估该复合物的分子连接、结合亲和力、动态稳定性效率和结构完整性。Cluspro分析显示,其具有-1655.0千卡/摩尔的强亲和力(最低能量)评分,包含28个成员,这一点得到了结合自由能值(-19.1千卡/摩尔)和解离常数(9.8×10-15M)的证实。该复合物的显著稳定性通过23个氢键和2个盐桥相互作用网络得以维持。

为了评估TLR4-疫苗复合物在分子动力学模拟过程中的整体结构稳定性,我们分析了200纳秒(ns)轨迹中主链原子的均方根偏差(RMSD)。RMSD曲线(图S2)显示,在最初的50纳秒内,RMSD从约0.3纳米急剧增加到约2.5纳米,这表明对接过程中施加的结构约束迅速松弛,与平衡过程和早期构象调整一致。在50至150纳秒之间,RMSD在1.5纳米到3.5纳米之间波动,反映了复合物的构象灵活性,这可能是由于TLR4等免疫受体典型的环运动或结构域重排所致。150纳秒后,系统趋于稳定,RMSD值稳定在3.2-3.4纳米左右,表明其收敛到相对稳定的构象状态或局部能量最小值。这种稳定性为进一步分析所采样的构象提供了可靠性支持。较高的RMSD幅度(>2.0纳米)突显了复合物的结构可塑性,这可能与受体识别或信号转导的生物学过程相关。尽管存在这些波动,但观察到的逐步稳定表明这是一个平衡良好的长时程模拟。

通过200纳秒模拟得到的TLR4-疫苗复合物的表面相互作用图谱,为动态结合界面提供了见解,捕捉到了关键的构象变化和分子间相互作用。由此产生的相互作用图突出显示了在生理条件下分子识别和复合物稳定性所涉及的稳定结合模式和关键残基。进一步的RMSD分析(图10A)显示,初始平衡阶段之后是稳定的波动(约0.10-0.125纳米),这证实了结构的收敛性,并表明该复合物在早期松弛阶段之后仍保持稳定构象。

RMSF图谱显示,整个蛋白质的原子波动极小,仅在残基190、300和34附近观察到轻微的峰值,这可能与柔性环或末端区域相关。总体较低的波动值增强了受体-疫苗界面的刚性和动态稳定性。使用Rg进一步评估复合物的结构紧凑性,结果显示在模拟过程中,Rg从约6.0 nm逐渐下降到4.25 nm以下。这种模式表明TLR4-疫苗构建体的紧凑性增强,结构更加紧密。同样,SASA在初始峰值后稳定在614至634 nm²之间,表明折叠状态稳定且溶剂暴露减少。这些发现表明三级结构和构象折叠得到了有效维持。氢键分析显示,TLR4受体与疫苗构建体之间的分子间氢键数量始终较多,范围在420至500之间,这增强了相互作用界面的牢固性和稳定性。此外,通过主成分分析(PCA)研究了复合物在整个200 ns模拟过程中的主要构象运动。时间分辨的PCA投影显示构象空间的探索具有渐进性和方向性,快照沿着前两个主成分(PC1和PC2)平滑过渡。重新访问区域的存在表明在动态受限空间内存在中间亚稳态构象和持续的相互作用。这种动态且有序的行为支持了一种灵活但稳定的结合模式,这对于受体结合和免疫刺激至关重要。总之,RMSD、RMSF、Rg、SASA、氢键和PCA的结果一致表明,在整个200 ns的分子动力学模拟中,TLR4-疫苗复合物保持了结构稳定、动态紧凑和功能有效。

这些发现证实了分子相互作用的强度和韧性,突显了该疫苗构建体在生理条件下持续激活TLR4的潜力,这是有效激活免疫的关键特性。

根据iMODS进行的NMA模拟,观察到的最小波动表明RabVac-TLR4复合物是稳定的,并表现出适当的刚性运动。总体而言,这些数据表明我们的候选疫苗可能通过激活TLR4信号通路来触发适应性免疫反应。

在计算机模拟免疫接种后,多次接种疫苗后检测到高水平的中和抗体、CD4+辅助性T细胞、记忆细胞和细胞因子。在二次和三次免疫应答期间,免疫球蛋白及其同种型的水平越来越高于初次反应后分泌的IgM水平,同时抗原滴度持续下降。

此外,疫苗可能会触发细胞毒性T细胞(TC)、辅助性T细胞(TH)和长效记忆B细胞的增殖,诱导巨噬细胞活性,并刺激自然杀伤细胞和中性粒细胞的产生。尽管辛普森指数(D)不相关,但也观察到了高水平的干扰素和白细胞介素-2释放。

确保在宿主中高效表达在很大程度上依赖于最终构建体中密码子的优化。因此,对密码子进行了优化,以达到58%的理想GC含量和0.92的密码子适应指数。mRNA二级结构的预测也至关重要,因为它是影响翻译起始、延伸和mRNA生物发生的关键因素。预测的结构显示出较高的mRNA稳定性,这与表达率的提高直接相关。

结论

综上所述,所提议的疫苗表现出显著的抗原性、良好的安全性记录,无致敏或毒性作用,与人无同源性,预测的人群覆盖率广泛,性质稳定,且在诱导保护性免疫反应方面具有效力,这表明它有望成为对抗狂犬病感染的候选疫苗。

然而,还需要进行后续的体外和体内湿实验室评估,以确定疫苗的效力。

局限性

虽然计算机设计的多表位狂犬病疫苗显示出巨大潜力,但它们也存在显著局限性。一个主要问题是表位预测算法的准确性,这些算法往往无法充分反映体内抗原加工和呈递的多层次复杂性。仅靠计算模型可能无法完美预测体内免疫动态,例如先天免疫和适应性免疫反应之间的相互作用、涉及的复杂细胞因子信号通路,以及持久免疫记忆的诱导——所有这些都是疫苗效力的关键因素。

所提出的嵌合疫苗模型在模拟中显示出较强的稳定性和免疫原性,但未经进一步测试,其对狂犬病感染的实际保护效力仍不确定。总体而言,未来的研究应优先开展体外和体内研究,包括动物攻毒实验,以评估其免疫原性和保护效力。

补充信息

以下是电子补充材料的链接。

补充材料1(1.8KB,txt)
补充材料2(276KB,doc)
补充材料3(176.5KB,文档)

作者贡献

W.T. 参与了概念构思、研究设计、方法学、调查、数据收集、正式分析、验证、可视化以及原始草稿的撰写;O.K. 进行了分子动力学模拟并开展了数据分析;H.O. 和 O.KA. 提供了专业的科学知识,验证了结果,并参与了手稿的关键修订;R.M. 协助进行了分子动力学实验和分析;K.G. 协调并监督了分子动力学实验;A.T. 监督了这项研究,并审阅了手稿。所有作者都对 manuscripts 的最终版本进行了审阅、编辑和批准。

数据可用性

本研究中提出的原创成果已包含在文章/补充材料中;进一步的咨询可直接联系通讯作者。

声明

利益冲突

作者声明不存在利益冲突。

补充信息:在线版本包含可在以下网址获取的补充材料。

脚注

出版商说明

施普林格·自然对于已发表地图中的管辖权主张以及机构隶属关系保持中立。

参考文献

Hits: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

分享