加州理工学院的新超算‘海狸’运行最初的酵母菌模拟程序,只需要十分钟,而原先的超算需要将近一百个小时。
不再是单纯的比拼算力,而是基因一号芯片配合曾凡专门设计的系统架构,能更好的适应模拟程序的运行。
新完成的果蝇模拟程序,超算第一次运行仍然消耗了十多个小时,这是一雌一雄同时模拟的完整过程,有了第一次的数据,后续模拟消耗时间会大幅度减少,这就是新超算系统的独特优势。
果蝇的细胞总数只有几十万,小白鼠的细胞总数一点五万亿以上,不过有了前面的数据积累,还有新型超级计算机的助力,模拟的难度没有细胞数目的差距那么大。
曾凡的实验计划是一年完成整个过程,小白鼠是哺乳动物,成长没有果蝇的变态过程,基因功能演化模拟的主要难度在胚胎发育阶段,只要这个起始阶段过去,后续难度会降低很多,可能都用不了一年时间。
为了配合曾凡的这个计划,帕米拉实验室的人员扩充到了八十多人,整个生物学部将近一半的人员都参与进来,如果人数不足,还可以随时找其他学校一起联合研究。
小白鼠和人类的基因组相似度超过百分之九十,如果能用超算成功模拟小白鼠,那距离模拟人类基因组的演化只有一步之遥,那意味着什么,很多人都清楚,学校内外有无数人都在默默关注着曾凡的模拟进程。
模拟从一颗受精卵细胞开始,雌鼠和雄鼠的染色体结合到一起,新的生命诞生,开始细胞的分裂过程。
别看果蝇到小白鼠基因的数目只从一万三增加到三万多,可是果蝇只有四对染色体,小白鼠却有二十对染色体,果蝇基因组碱基对一点四亿,小白鼠却有二十七亿,信息含量完全不是一个数量级。
碱基序列增加可不仅仅是模拟的复杂度提升,而是计算机模拟基因序列解螺旋和复制,rna翻译的拼接肽链时间会更长,也更容易出错。
实际生命的诞生过程中同样会出错,有的错误不影响全局,可以忽略过去,有的错误可能导致整个基因复制中断,那就意味着失败,生命还没诞生就结束了。
越是开始阶段,这个过程当然越重要,受精卵第一次分裂在超算上面的演化模拟进行了整整一天的时间,不知道中断了多少次,曾凡不断修改数据,直到晚上十二点过才离开实验室回去睡觉,次日早早的又来到实验室。
超算并没有因为错误自动中止,演化模拟依然在持续进行,细胞分裂已经进行了上百次,已经从一个细胞变成了一个小肉团。
检查了一遍后台的数据,一切正常,并没有中断的记录,比果蝇演化刚开始的时候顺利了很多。
然后又检查分裂出来的细胞中的基因序列,看看有没有太多的错误,基因解螺旋复制再拼接组合的过程肯定会有错误,只要错误不影响后续发育就行,这部分模拟程序自身也会进行检查,小错误会自动修正,错误太大同样会自动中止。
相比较原先的超算,海狸自动修正功能更加优秀,这也是第一次分裂完成后,后续进展这么顺利的根本原因。
通过之前酵母菌,果蝇的模拟积累的数据,关于基因的复制转录,翻译到蛋白质的过程已经有了足够多的精确信息,这些信息总结出来的基本规律都是一样的,包括现在的小白鼠,微观上的演化过程都一样,区别的只是复杂程度。
就像木工的榫卯结构,基本原理和手法都相同,酵母菌是做了一个鲁班锁玩具,果蝇就相当于做了一套家具,小白鼠就相当于要做出一套纯木结构建筑。
基因组就相当于建造图纸,计算机演化模拟就是复现整个建造过程,前面的酵母菌和果蝇的模拟已经锻炼出来建筑技术,可以完成大部分小白鼠的演化模拟,但是这个工程毕竟更大,还涉及到更高深的建筑手段,肯定需要在不断试错中完成。
加州理工学院的新超算‘海狸’运行最初的酵母菌模拟程序,只需要十分钟,而原先的超算需要将近一百个小时。
不再是单纯的比拼算力,而是基因一号芯片配合曾凡专门设计的系统架构,能更好的适应模拟程序的运行。
新完成的果蝇模拟程序,超算第一次运行仍然消耗了十多个小时,这是一雌一雄同时模拟的完整过程,有了第一次的数据,后续模拟消耗时间会大幅度减少,这就是新超算系统的独特优势。
果蝇的细胞总数只有几十万,小白鼠的细胞总数一点五万亿以上,不过有了前面的数据积累,还有新型超级计算机的助力,模拟的难度没有细胞数目的差距那么大。
曾凡的实验计划是一年完成整个过程,小白鼠是哺乳动物,成长没有果蝇的变态过程,基因功能演化模拟的主要难度在胚胎发育阶段,只要这个起始阶段过去,后续难度会降低很多,可能都用不了一年时间。
为了配合曾凡的这个计划,帕米拉实验室的人员扩充到了八十多人,整个生物学部将近一半的人员都参与进来,如果人数不足,还可以随时找其他学校一起联合研究。
小白鼠和人类的基因组相似度超过百分之九十,如果能用超算成功模拟小白鼠,那距离模拟人类基因组的演化只有一步之遥,那意味着什么,很多人都清楚,学校内外有无数人都在默默关注着曾凡的模拟进程。
模拟从一颗受精卵细胞开始,雌鼠和雄鼠的染色体结合到一起,新的生命诞生,开始细胞的分裂过程。
别看果蝇到小白鼠基因的数目只从一万三增加到三万多,可是果蝇只有四对染色体,小白鼠却有二十对染色体,果蝇基因组碱基对一点四亿,小白鼠却有二十七亿,信息含量完全不是一个数量级。
碱基序列增加可不仅仅是模拟的复杂度提升,而是计算机模拟基因序列解螺旋和复制,rna翻译的拼接肽链时间会更长,也更容易出错。
实际生命的诞生过程中同样会出错,有的错误不影响全局,可以忽略过去,有的错误可能导致整个基因复制中断,那就意味着失败,生命还没诞生就结束了。
越是开始阶段,这个过程当然越重要,受精卵第一次分裂在超算上面的演化模拟进行了整整一天的时间,不知道中断了多少次,曾凡不断修改数据,直到晚上十二点过才离开实验室回去睡觉,次日早早的又来到实验室。
超算并没有因为错误自动中止,演化模拟依然在持续进行,细胞分裂已经进行了上百次,已经从一个细胞变成了一个小肉团。
检查了一遍后台的数据,一切正常,并没有中断的记录,比果蝇演化刚开始的时候顺利了很多。
然后又检查分裂出来的细胞中的基因序列,看看有没有太多的错误,基因解螺旋复制再拼接组合的过程肯定会有错误,只要错误不影响后续发育就行,这部分模拟程序自身也会进行检查,小错误会自动修正,错误太大同样会自动中止。
相比较原先的超算,海狸自动修正功能更加优秀,这也是第一次分裂完成后,后续进展这么顺利的根本原因。
通过之前酵母菌,果蝇的模拟积累的数据,关于基因的复制转录,翻译到蛋白质的过程已经有了足够多的精确信息,这些信息总结出来的基本规律都是一样的,包括现在的小白鼠,微观上的演化过程都一样,区别的只是复杂程度。
就像木工的榫卯结构,基本原理和手法都相同,酵母菌是做了一个鲁班锁玩具,果蝇就相当于做了一套家具,小白鼠就相当于要做出一套纯木结构建筑。
基因组就相当于建造图纸,计算机演化模拟就是复现整个建造过程,前面的酵母菌和果蝇的模拟已经锻炼出来建筑技术,可以完成大部分小白鼠的演化模拟,但是这个工程毕竟更大,还涉及到更高深的建筑手段,肯定需要在不断试错中完成。