人工智能(AI)正越来越多地被应用于药物研发过程中。一些观点认为人工智能可以极大地促进药物研发,而另外一些则仍然持保守态度,在观望AI技术的影响。现实中大多数人的态度可能处于此两者之间,但是很明确的一点是AI技术给科学家以及生物制药行业都带来了极大地影响。本文就小分子药物研发中AI技术的应用,对众多国际专家的观点进行了归纳和总结。 除了技术问题外, 人工智能在药物研发中的成功应用的最大挑战还在于培养相关人员的适当思维方式以及相对应的文化氛围,以使他们愿意应用这些计算模型并使用其结果。 在药物设计领域中,利益相关者包括来自各个学科的研究人员以及商人,各方对机器学习的认知程度并不相同。要做到这一点,首先要认识到各个利益相关者的不同经历,然后发展通用的术语和规范。在大学层面上要促进这种趋势则需要教育和指导学生进行批判性思维,使其变得自我反省,包容其他的思维方式,学生就可以向同事(包括其他研究领域的人员)或者广为广阔的受众来解释AI可以在哪些领域进行扩大以及支持相关的发展(而不是进行替代)。 制药公司已经开始应用AI相关技术以及各种机器学习方法,但是并没有将全部的赌注都压在AI上面,这是可以理解的。考虑到药物研发的复杂性和受监管的特性,建议采取一种好奇而谨慎的态度进行尝试。在药物设计中开发AI应用程序时需要长期的时间,但AI可以提高所涉及的各个研究过程的效率,并减少研究文化之间的壁垒。 分子描述符和分子指纹 1.1 分子描述符和分子指纹概念 1.2 分子描述符类别和特点 1.3 分子指纹的类别和特点 2. 分子描述符/指纹计算软件 2.1 分子表示方法和格式 2.1.1 SMILES,SMARTS,SDF, MOL, MOL2, PDB 2.1.2 JEM Editor, Chemdoodle, ChemAxon, ChemDraw, DrugBank 2.2 RDKit简介及环境部署 2.3 RDKit中如何操作分子 2.4 RDKit中描述符的计算以及存储 2.5 OpenBabel简介及环境部署 2.6 OpenBabel操作分子和格式转换 2.7 OpenBabel中的分子描述符和指纹 2.8 ChemDes计算分子描述符和 2.9 ChemDes计算分子指纹 2.10 ChemDes中的格式转换 2.11 ChemDes中的分子优化 2.12 PyBioMed 简介环境部署 2.13 PyBioMed 获取分子 2.14 PyBioMed 计算分子描述符 2.15 PyBioMed 计算分子指纹 2.16 PyBioMed 计算蛋白质描述符 2.17PyBioMed 计算核酸描述符 2.18 PyBioMed 计算相互作用描述符 结构预处理和数据预处理 3.1 PyBioMed结构预处理 3.2 ChemSAR结构预处理 3.3 KNIME 结构预处理 3.4 Excel数据预处理及注意的问题 3.5 KNIME数据预处理 3.6 Pandas环境配置以及基本操作 3.6 sklearn数据预处理 3.7 归一化与空值处理 算法简单介绍和分类 4.1 药物设计中人工智能常用算法简介 4.2 常用算法实现软件或工具介绍 5. KNIME软件介绍 5.1 KNIME软件特色和界面 5.2 KNIME软件构建基本计算任务 5.3 KNIME软件社区支持 5.4 KNIME软件定制化插件 5.5 KNIME软件第三方支持 特征选择 6.1 基于sklearn的特征选择 6.1.1 相关性分析,相关性绘图 6.1.2 单变量特征选择及选择K个特征 6.1.3 递归式特征删除 6.2 基于KNIME流程的特征选择 6.2.1 相关性分析,相关性绘图 6.2.2 单变量特征选择 6.2.3 递归式特征删除 7. 模型的评价与解释 7.1 回归模型和分类模型的评价指标 7.2 应用域的评估 7.3 基于树的模型的解释 ADMET介绍 8.1 ADMET概念以及意义 8.2 基于人工智能的ADMET虚拟评价方法的进展 8.3 ADMET计算资源(ADMETlab、ADMETsar等) 9. KNIME软件构建ADMET模型 9.1 KNIME软件配置相关插件 9.2 caco-2细胞渗透性数据概览 9.3 结构预处理 9.4 描述符和指纹计算 9.5 SVM模型构建以及参数调整 9.6 RF模型构架及参数调整 9.7 RNN模型构建以及简单超参数调整 10. ADMET计算软件和实操 10.1 ADMETlab(v1.0 与v2.0)计算平台使用 10.2 admetSAR计算平台使用 10.3 本地模型调用以及预测 噪声过滤和相似性搜索 11.1 FAFDrugs4过滤 11.2 指纹和相似性度量计算 11.3 Swiss-Similarity相似性搜索 12. 机器学习模型构建和预测 12.1 收集GRK2化合物(讲解过程) 12.2 计算合适的分子表征 12.3 算法和特征选择 12.4 模型构建和评价 12.5 应用模型筛选化合物库 13. 分子对接 13.1 蛋白质预处理 13.2 小分子预处理 13.3 可应用Swiss-Dock对接 14. ADMET评估 14.1 ADMETlab计算并评估 14.2 确定相关性质的参考范围 14.3 评估并确定Hits.