开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
一、课题研究背景和意义
成药性是衡量化合物能否进入临床并最终上市最重要的参考指标之一。成药性是指药物除了药理活性以外的所有其他性质, 即化合物具有能够进入临床I期试验的药代动力学和安全性的性质,包括物理化学性质、生物化学性质、药代动力学性质和毒副作用。活性和成药性是成功药物的充分条件,两者互为依存, 互相影响,构成了创制新药的两大支柱。同时,化学结构是内在活性和成药性的载体,药物的分子结构是呈现药理活性和成药性的物质基础, 体现分子结构的特征, 包括: 相对分子质量、 分子大小、分子组成、分子形状、pKa、氢键供体、氢键接受体、极性表面积、可旋转键和功能基分布等。[1]
1997年,Lipinski 提出类药五规则,开启了类药性(Drug-likeness)研究的先河。此后,世界各国的药物化学家进行了积极的探索,提出并建立了类先导性 (Lead-likeness) 、天然产物类似物(Natural product-likeness)与代谢物类似物(Metabolite-likeness)和生物相关性(Bio-Relevance)等类似表示化合物成药能力的筛选原则和理论指标。[4]在药物开发项目的初期阶段,成药性信息的缺乏和靶向性误差是导致失败的主要原因。所以在当代药物设计和药物筛选过程中,化合物的成药性预测非常关键。成药性预测方法主要包括基于核磁共振(NMR)筛选和高通量筛选(HTS)技术的实验方法和计算机法。实验方法由于局限性较大,仅适用于更具体的成药性研究(如最近对CBP/p300 KIX结构域蛋白的成药性评价[3]),在大规模研究或探索新的药物靶点的情况下,往往给计算机方法让路。[2]计算机法主要包括虚拟筛选评估、机器学习法、系统生物学法。
机器学习是人工智能的一个分支,是指让机器通过大量样本的训练,获得了一定的经验(模型),从而产生了能够预测新事物的能力的过程,这种预测能力,本质上是输入到输出的映射。
本课题拟通过机器学习等算法对药物结构特征进行有效提取,然后构建成药性预测模型,加快药物的早期设计与筛选过程,以减少药物研发投入和风险。
二、课题研究内容
机器学习算法包括传统学习算法和深度学习算法。虽然传统的机器学习算法相对于深度学习算法而言显得不那么潮流,但它至今还有很大的应用价值,在一些特定的问题中使用起来更加快速、灵活。传统机器学习算法包括线性回归、逻辑回归、朴素贝叶斯、支持向量机(SVM)、K最邻近算法(KNN)、Boosting、随机森林算法等。本课题旨在构建传统机器学习模型、预测化合物成药性,研究思路如下:
1.机器学习相关概念的理解
从Web of Science 科学索引和ACS美国化学学会电子期刊等途径检索机器学习算法有关文献,并翻阅图书馆相关书籍,对机器学习算法具备初步了解。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。