从某种意义来说,当孙剑峰把真实的自我带入三维角色中的那一刻,

导语:未来几年,国内很多企业对企业大数据挖掘、决策,这个过程中正需要运筹优化的技术,这些技术帮助企业将大数据转换为真正的决策。在上一期雷锋网(公众号:雷锋网)ai掘金

【CIMIC】11 11 京东全球好物节

通常,我们为房子增配家具前,都会事先量好各个位置的尺寸,然后在商场中凭借模糊印象或者照片挑选家具

分享到:

导语:对于人类基因组,我们可能认识了不少单词,粗略地理解了语法,但还完全不懂断句,我们对整篇文章一无所知随着基因测序价格以超摩尔定律的势态下降,其被广泛应用于基因组学研究、临床诊断以及多种疾病个性化治疗等领域。对此,业内人士认为,当今基因测序行业面临最大的挑战已不再是基因测序技术,而是处理巨大的数据量以及如何从巨大数据中获取临床指导。据雷锋网了解,生物信息分析是目前业界公认的最具发掘潜力以及盈利能力的环节,但目前国内还处于起步阶段。

那么,基因数据与其他数据有何异同?处理基因数据又何难点和挑战?基因数据的未来是怎样的?本次公开课,雷锋网(公众号:雷锋网)ai掘金志栏目邀请了华大基因研发中心副总监金鑫,带来《基因大数据简史——起源、现状和未来》的主题演讲。

嘉宾介绍:华大股份研发中心副总监、bgionline平台负责人金鑫,华大基因的青年科学家。金鑫曾参与了一系列重大科研项目攻坚,包括国际千人基因组计划、中丹糖尿病基因组计划、人类泛基因组图谱计划、高原基因组计划,及自闭症基因组计划等。早在2009年,金鑫就以在校生的身份在《nature》子刊《naturebiotechnology》发表《构建人类泛基因组序列图谱》,并首次提出了“人类泛基因组”概念。

公开课视频:(注:本次公开课中,金鑫博士展示有趣的案例,并回答多个网友精彩问题,所以推荐优先观看视频。)

以下是金鑫博士演讲内容,雷锋网做了不改变原意的编辑:

我是金鑫,来自华大基因,我现在是华大股份研发中心副总监,同时也是bgionline和大数据专项的负责人。今天我想跟大家分享的题目是基因数据起源、传承与演化。

我们都说基因是上帝的语言,在说基因之前,我先给大家看一块石碑,这块石碑叫罗塞塔石碑,已经保存了2200多年,大约是公元前197年制作的,其上面刻有多种语言:希腊文字、埃及象形文字、也有当时埃及的民间文字、罗马文字。实际上,石碑是迄今为止已知的保存信息最长久的一种载体。我们身体里有很多细胞,每个细胞里都有一个完整的基因组,基因组上所承载信息的载体是atcg这四个非常简单的基本单元,我们称之为碱基。从地球上有生命起,绝大部分已知的地球生物都是通过dna的形式来承载我们生命的全部秘密,但所谓的承载和传递并不是只做一次记录,更多的是通过不断的复制把它传递下去,而且传递过程并不是非常精确的完整复制过程,这使得如今整个地球上的物种成千上万、丰富多彩。

基因的起源很多年前,人类就开始了读基因天书的努力。

在20世纪,人类有三大科学创举:1945年的曼哈顿原子弹计划、1969年的阿波罗登月计划和2000年前后完成的人类基因组计划。

从一开始,我们就是人类基因组计划中的一份子,当时一共有6个国家参加,美、英、法、德、日、中,中国是唯一一个参与人类基因组计划的发展中国家。1999年9月9日,华大基因为完成人类基因组计划中国部分那个1%而成立的。当时要去读取人的基因数据,需要做一个完整的人类基因参考序列,就像一个地图导航坐标系一样,这其实是非常困难的。6个国家成百上千科学家花费了13年时间和30亿美金才完成了第一个人的基因组测序,当然,这个过程中,也带来很多相关学科、技术和产业的发展。我想给大家讲的是,2000年之前,读一个人的基因数据要耗巨资需要十几年的时间。

如今,是一个数据的时代,一个互联网的时代,一个智能的时代,而所有这一切的核心是我们今天讲的数据。

相比其他数据,基因数据的产生有很多特别的地方,基因数据的获取需要一个特别的设备——基因测序仪。2015年10月份,中国第一款的国产自主知识产权的基。