为了从新鲜数据中提取信息,深度学习采用了算法,通常是在海量数据上训练的神经网络。凭借其一步步的指示,它跟传统的计算有很大的不同。相反,它从数据中学习。深度学习远没有传统计算机编程那么透明,它留下了一些重要的问题没有解决:系统学到了什么,它知道什么?
据了解,蛋白质存在于每一个生物体中。它们为细胞提供结构、催化化学过程、运输小分子、消化食物并执行许多其他功能。它们由氨基酸的长链组成,像线上的珠子一样串在一起。然而为了使蛋白质在细胞内发挥其功能,它必须折叠成一个复杂的三维结构,这一过程被称为蛋白质折叠。折叠不当的蛋白质会导致疾病。
Christiaan Anfinsen在他1972年的诺贝尔化学奖接受演讲中提出假设,从一个蛋白质的氨基酸序列来计算其三维结构应该是可行的。
氨基酸的排列决定了蛋白质的特性和形式,最终决定了其功能。
由于氨基酸构建块的内在灵活性,一个典型的蛋白质可能会有约10到300种不同的配置。这一数量超过了宇宙中原子的总数。然而在一毫秒内,生物体内的每一种蛋白质都会折叠成它自己的独特形式--构成蛋白质的所有化学键的最低能量构型。只要改变蛋白质中通常包含的数百个氨基酸中的一个,它就可能不再正常折叠或发挥作用。