DeepPurpose 是一个基于深度学习的药物-靶标相互作用(Drug-Target Interaction, DTI)预测工具。它支持多种编码方式和数据集,能够帮助用户预测药物与靶标之间的结合能力,广泛应用于药物筛选、靶标识别和药物重定位等领域。
DeepPurpose 提供了以下三种常用的数据集:
建议选择:
DAVISKIBABindingDBDeepPurpose 支持多种药物和靶标的编码方式:
CNN、MPNN、MorganCNN、AAC编码方法说明:
建议选择:若关注结构细节,优先 MPNN;若快速筛选,优先 Morgan;若处理序列,优先 CNN;若只需全局蛋白特征,可选 AAC。
输入文件应为 TSV 格式,包含以下列:
若不填写名称,系统将自动生成 Drug1, Drug2 / Target1, Target2。
| SMILES | Protein Sequence | Drug Name | Target Name |
|---|---|---|---|
| CCO | MVLSPADKTNVKAAW | Drug1 | Target1 |
| CCN(CC)CC | GAVLILKKK | Drug2 | Target2 |
运行完成后,工具将生成以下文件:
结果文件夹
├── config.pkl [模型参数与超参数配置文件]
├── model.pt [训练好的预训练模型权重]
└── virtual_screening_{dataset}_{drug_encode}_{target_encode}.txt [筛选后的药物-靶标预测结果]
| Rank | Drug Name | Target Name | Binding Score |
|---|---|---|---|
| 1 | Drug1 | Target1 | 6.15 |
| 2 | Drug2 | Target2 | 5.03 |
字段说明:
工具使用多种预训练模型进行预测,模型权重保存在 model.pt,超参数配置保存在 config.pkl。常见参数包括:
用户可在 config.pkl 中使用python pickle库查看这些参数。
import pickle
# 读取 .pkl 文件
with open("config.pkl", "rb") as f:
config = pickle.load(f)
# 查看内容
print(f"\nConfig 内容:{config}")
DeepPurpose 本身不提供单独的置信度分数,但默认采用多模型集成策略(ensemble of pretrained models)来提高预测稳定性。用户可根据同一数据集不同模型预测结果的方差来近似评估预测可信度:方差越小,说明各模型预测一致性越高,可信度越高。