Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用( 十 )


4.挑战和机遇尽管图表示学习在不同的生物医学任务中显示出了良好的结果,但多组学数据集成将继续促进生物和医学研究 。然而,目前关于生物医学图的图表示学习并不足以在任何条件下为任何生物和医学图提供令人难以置信的解决方案 。未来的发展方向既有挑战,也有机遇 。
4.1 数据质量与其他领域干净、组织良好的数据相比,生物医学图通常稀疏、噪声和不完整 。
同时,收集原始和可靠的数据通常需要耗时和费力的湿实验,并且需要进行大量的湿实验 。同时,生物医学数据分散、积累快,缺乏良好的结构 。鉴于生物医学数据的稀疏性和不完全性,更好地集成多源高质量数据并开发有针对性的图表示学习方法是一个具有挑战性的问题 。
4.2 复杂的图结构图结构在生物医学和医疗保健应用中具有灵活性和复杂性 。人们对同质图的处理做了各种努力,一些工作考虑了更复杂的图结构,例如异构图和时空动态图(在现实的生物医学场景中,节点和链接可能会出现和消失,图会随时间动态变化) 。此外,scRNA-seq数据和与领域知识相关的数据也提供了有希望的机会,但这些数据具有复杂的图表结构 。如何处理面向下游应用的复杂生物医学图是一个很有前景的问题 。
4.3 可解释性和鲁棒性生物医学的风险敏感场景对图表示学习方法的可解释性和鲁棒性提出了更高的要求,而基于神经网络的GNN仍然是黑盒,缺乏可解释性 。因此,解释深度图学习结果的能力在决策应用中至关重要 。此外,作为许多基于深度学习的模型,如CV和NLP领域,这些图表示学习方法容易受到对抗性攻击 。更强大和可解释的图表示学习方法对于将图表示学习应用于具有可信解释和可信防御的生物医学问题非常重要 。
结论图表示学习将全面的图结构生物医学数据和先进的机器学习方法联系起来,促进了从分子到医疗保健系统的生物医学研究 。在这项工作中,我们对图表示学习及其在生物信息学中的应用进行了全面和系统的调查 。总结了图嵌入方法(包括同构图嵌入、异构图嵌入、属性网络嵌入)和新兴的GNN(如GRN、GCN、GAE和GGAN) 。我们分析了图表示学习在分子、基因组学、制药和医疗保健领域的代表性应用 。此外,还总结了用于图表示学习的开源平台和库 。我们相信这项工作可以促进图表示学习和生物医学研究 。
【Briefings in Bioinformatics-2021 知识图谱-生物信息学-医学顶刊论文:生物信息学中的图表示学习:趋势、方法和应用】

经验总结扩展阅读