最近,已经提出了一种非常有用的方法,称为“pLoc_Deep-mHum”,用于发现针对 Pandemic COVID-19。这份简短的报告中说明了如何使用其网络服务器的分步指南。
关键词
冠状病毒,人类 蛋白质,多 标签 系统, PseAAC ,五步法
2020 年,已经建立了一个非常强大的网络服务器预测器,用于仅基于序列信息来识别人类蛋白质的亚细胞定位 [ 1 ],其中相同的蛋白质可能会在两个或多个位置位点之间出现或移动,因此需要用多标签方法 [ 2 ] 进行标记。
网络服务器预测器称为“pLoc_Deep-mHum”,其中“深度”表示网络服务器已通过“深度学习”技术[ 3 6 ]进一步改进,“m”表示能够处理多标签系统。
此外,通过使用计算生物学中广泛使用的“Pseudo Amino Acid Component”[ 7 ] 或“PseAAC”[ 8 ] 处理(参见例如 [ 9136 ] 和“ 5步规则” [ 137 ] 广泛且越来越多地用于系统生物学和生物医学(参见,例如,[ 4 138 160 ])。
要了解网络服务器的工作原理,请执行以下操作。
Step 1. 点击http://www.jci-bioinfo.cn/pLoc_Deep-mHum/的链接,pLoc_bal-mHumweb-server的首页会出现在你的电脑屏幕上,如图1所示。单击 Read Me 按钮可查看有关预测器的简要介绍。
步骤 2. 将查询人类蛋白质的序列键入或复制/粘贴到图 1中心的输入框中。输入序列应为 FASTA 格式。对于 FASTA 格式的序列示例,单击输入框正上方的示例按钮。
步骤 3. 点击提交按钮查看预测结果。例如,如果您使用示例窗口中的四个蛋白质序列作为输入,10 秒左右后,您将看到一个新屏幕(图 2) 发生。在其上部列出了当前预测器覆盖的从 (1) 到 (14) 编号的亚细胞位置的名称。下半部分是预测结果:example-1的查询蛋白O15382对应“10”,即只属于“线粒体”;example-2的查询蛋白P08962对应“8, 13”,表示属于“溶酶体”和“质膜”;example-3 的查询蛋白 P12272 对应“2, 6, 11”,表示它属于“Cytoplasm”、“Extracellular”和“Nucleus”。所有这些结果都与实验观察完全一致。
图 1。pLoc_Deep-mHum 的 Web 服务器的首页。
图 2。通过步骤 2 获得的计算机上显示的新屏幕。
步骤 4.如图 2下方面板所示,您还可以通过 Browse 按钮输入您的电子邮件地址和所需的批量输入文件(当然是 FASTA 格式)来选择批量预测。要查看批处理输入文件的示例,请单击按钮 Batch-example。点击Batch-submit按钮后,你会看到“Your batch job is under computing; 一旦结果可用,您将收到电子邮件通知。”
第 5 步。点击 Citation 按钮,查找在开发当前 pLoc_Deep-mEuk 预测器方面发挥关键作用的论文。
步骤 6. 单击支持信息按钮下载本文中提到的支持信息。
利益冲突
作者声明与本文的出版没有利益冲突。
参考
[ 1 ] Shao, YT, Liu, XX, Lu, Z. 和 Chou, KC (2020) pLoc_Deep-mHum:通过深度学习预测人类蛋白质的亚细胞定位。自然科学,1-31,第 12 卷,第 7 期,526-551。
[ 2 ] Chou, KC (2019) 预测多标签蛋白亚细胞定位的进展及其对开发多靶点药物的意义。当前药物化学,26, 4918-4943。
[ 3 ] Maxwell, A.、Li, R.、Yang, B.、Weng, H.、Ou, A.、Hong, H.、Zhou, Z.、Gong, P. 和 Zhang, C. (2017) 深度学习架构用于智能健康风险预测的多标签分类。BMC 生物信息学,18,第 523 条。
[ 4 ] Khan, S.、Khan, M.、Iqbal, N.、Hussain, T.、Khan, SA 和 Chou, KC(2020 年)基于深度学习算法的两级计算模型,用于通过 Chou 识别 piRNA 及其功能5 步规则。国际肽研究与治疗杂志,26, 795-809。