测试几万个数据为何可能破解生命之谜?_表型_人类
2003年,被誉为生命科学 “登月操持”的“人类基因组操持”发布终极完成。本日,人类表型组研究正成为生命科学新的计策制高点。中国是最早推动“人类表型组”国际大科学操持的发起方之一。2017年,复旦大学人类表型组研究院组建,研究院承担了上海市首批市级科技重大专项“国际人类表型组操持(一期)”的事情。
什么是人类表型组研究,为什么要开展人类表型组研究,人类表型组研究为什么可能更多地揭示生命奥秘?初秋的一天,来到了位于复旦张江校区的人类表型组研究院,亲自感想熏染这里的详细事情。
基因组之外
为什么还要进行表型组研究?
人类的基因DNA是一种双螺旋构造的物质。基因有两个特点,一是能虔诚地复制自己,以保持生物的基本特色;二是基因能够“突变”,有些突变会导致疾病,其余的绝大多数为非致病突变。非致病突变给自然选择带来了可能,使生物可以在自然选择中当选择出最适宜自然的个体,这也是达尔文提出的“进化”的生物学根本。
有一个问题很故意思,为什么生物的身体可以保持一个比较恒定的尺寸,不会溘然变大,也不会溘然变小呢?答案是人体中一贯在进行拼图游戏。科学家们创造:如果人体中一种蛋白质由于环境变革而溘然减少时,能够产生这些蛋白质的细胞就接到指令要增产,补足人体中短缺的蛋白质;反之,如果某种蛋白质数量太大,产生这种蛋白质的细胞也会收到指令从而停滞生产。用学术化的措辞表达便是:在细胞核中以DNA为模板转录出mRNA, 然后在核糖体年夜将mRNA翻译成多肽,肽链弯曲盘旋形成蛋白质,这便是“中央法则”的紧张内容。在这个过程中,DNA就像是辅导员,mRNA像是邮递员的角色。
人类基因组操持测出了30亿个碱基对的序列,科学家们搜索了所有人类基因并找出它们在染色体上的位置,破译人类全部遗传信息。但是从遗传学角度看,个中大约仅有小部分的片段有非常主要的意义。众所周知的是基因可以编码蛋白质,进而影响我们人体的各种运行,但是并不是所有的片段都可以被转录后翻译成蛋白质。在学术上可以被转录并被翻译的基因片段被称为外显子(exon),这些外显子对应的mRNA片段组成的成熟mRNA可以在核糖体上翻译为蛋白质。能被转录但不能被翻译的基因片段是内含子(intron),它们虽不能被翻译为蛋白质,但是可能参与调控蛋白质的翻译或其他生物学过程。这就好比在一块菜地撒了很多种子,只有少部分可以萌发。
30多年前,由于科学家所能节制的技能手段还没有像本日这样多,生命科学研究在方向选择时,决定向基因组聚焦:探求基因与表型的关联,这就出身了“人类基因组操持”。人类基因组操持取得了很大的造诣,本日大家都熟知可以用基因检测来诊断部分疾病,便是人类基因组操持研究成果的一个主要运用。但是,基因组研究也有很大的局限性。大略说来,这种局限紧张有:基因组无法阐明所有的致病缘故原由,比如为什么有的人在中国不过敏,到美国却过敏了?同时,在现在成熟的测序技能手段背景下,基因组创造的疾病靶点险些已经穷尽了,可还是有很多疾病并没有找到对应的靶点。换句话说,光有基因组研究对付破解康健奥秘还远远不足,人类基因组操持还没有完成精密解构人体“小宇宙”这一主要任务。
串起生命接力棒
科学家想探寻什么?
现在,破解生命奥秘的科研接力棒交到了表型组研究手上。
表型是生物体的特色,个中包括物理类表型、化学类表型和生物类表型。这些生物特色由基因和环境相互浸染而决定。而所谓表型组则是生物体从胚胎发育到出生、发展、朽迈乃至去世亡过程中,形态特色、分子组成规律、功能和行为等的凑集。
人类遗传学家、中国科学院院士、国际人类表型组研究协作组共同发起人、复旦大学常务副校长金力见告,几十年来科学技能的发展,使我们现在可以对人类表型组进行系统精密的跨尺度丈量,开展人类表型组操持的条件已经成熟。科学家希望通过系统精密丈量获取海量数据后,终极找出基因-表型-环境之间,以及宏不雅观与微不雅观表型之间的关联机制与相互浸染。这是一张立体网络,由表不雅观基因组、转录组、蛋白质组、代谢组、细胞、器官、影像、体质和生理等等跨尺度、多维度的各种类型表型组成。个中转录组、蛋白质组、代谢组是微不雅观表型,又称为分子表型,器官、影像、体质、生理和人体功能等表型属于宏不雅观表型。“表型组研究是大数据和人工智能时期的生物学。”金力指出,“科学界希望通过全景表型丈量与数据汇算剖析,帮助人们终极弄明白从基因到各尺度表型特色的关联机制及其对人体康健与疾病的影响。”而人类表型组操持的科学创造,终极将支撑人类更加精准地干预和治疗疾病,调控和管理康健。
对付这种关联机制,复旦人类遗传学与人类学系主任、人类表型组研究院博士后事情站站长王久存教授将它比喻成一个“工厂”。她见告,人体的功能运行是这样的:DNA 转录为mRNA,再翻译成为蛋白质,而蛋白质实质上是大分子,大分子中有酶,起到的是催化浸染。人体摄入的各种营养物质,都是酶这种“大分子机器”的“质料”,食品中的淀粉、蛋白和脂肪在酶的浸染下被降解为各种小分子,包括葡萄糖、氨基酸、脂肪酸等,比如淀粉就可以被降解为葡萄糖。这些小分子又进一步经由各种环节,产生人体所需的能量。大部分食品都被转化为小分子,但是这个工厂的运行并不是单向的,它还可以这些小分子为质料,合成人体所须要的大分子,比如人体合成蛋白质所需的氨基酸,有12种可以自主合成,其余8种须要从食品中摄入。“在研究的过程中,你会惊奇地创造险些人体所有的表型都能找到背后的科学依据,末了也险些都能追踪到基因。比如肺癌患者,其器官与正凡人不同,往前追踪,其细胞、代谢组、蛋白质组、转录组的表型指征也都与正凡人不同。”王久存先容说,“研究中,部分肺癌患者在不同尺度涌现的表型指征,可以关联到一个或多个基因突变位点,这就建立了我们想要找到的致病分子机制或生物标志物。大概未来这就能成为癌症早筛或治疗的新靶点”。
2万个检测指标
志愿者须要供应哪些样本?
在复旦大学人类表型组研究院,作为志愿者体验了表型组全景精密丈量的科学研究过程。
作为上海市首批市级重大专项“国际人类表型组操持(一期)”中的核心行列步队研究,科学家们将采集1000名长期居住在上海的20岁到60岁的康健人的表型数据,每个志愿者将被检测2万多个表型指标。对付志愿者的哀求是长期居住在上海,没有高血压、糖尿病、心脑血管疾病、癌症等重大疾病。
在本人知情赞许的条件下,参与研究的志愿者将在复旦大学人类表型组研究院度过两天一夜。这里对志愿者有一些分外的哀求,比如检测前24小时内,只管即便不要利用任何扮装品及洗濯用品,检测当天额头、前臂、头皮及后背不要打仗谁,也不要利用任何护肤品,不能服用含有咖啡因的食品。
首先是测身高、体重、血压(旁边手)、握力(旁边手),供应一小试管唾沫。复旦大学人类表型组研究院表型测试平台主任罗竞春见告,科研职员会测试唾沫中的各种微生物。
随后又陆续走进了皮肤检讨室、感官评价室、听力和语音室、生理测试室、DX体成份检讨室、超声表型测试室、中医表型检测室、生物电表型丈量平台、就寝监测中央等,开始了劳碌的志愿者生活。
皮肤数据的采集就有很多类型,丈量皮肤的酸碱度、弹性、纹路、指纹、掌纹,还会将腰部的皮肤在仿照日光下照射一段韶光,第二天事情职员会不雅观察皮肤颜色的变革,不雅观察皮肤是否耐晒,是否会变色。指纹与基因的关系是近年来科学家破解的人类表型组研究的重大成果,指纹有3种表现,分别是弓型、箕型、斗型。一开始科研职员认为10个手指的表型可能对应10个基因。但是在用大样本研究后创造,它们只与3个基因有关系,两个大拇指对应一个基因,两个小拇指对应一个基因,6个中间的手指对应一个基因。而用小鼠进行干系实验后创造,这3个基因与肢体发育有关系,由于发育过程的受力程度不同,末了导致了指纹形态涌现差别。在复旦人类表型组研究院,各种皮肤的采集数据总和多达几百个。
感官测试中的嗅觉测试须要志愿者闻出50个样本的气味,在选择题中选出答案;在听力测试中,旁边耳是单独测试的,听到眇小的声音要按下确认键。之后,在测试志愿者左耳时,事情职员会在右耳的耳塞中加入滋扰音,右耳测试也是如此;在做语音测试时,事情职员会在你的喉部绑上一个测试装置,然后就开始按照提示读出几段话,哀求是比较连贯。
在中医表型检测室中,事情职员会通过中医四诊仪采集舌面部图像,还会将分外装置放在手腕部的脉搏上,丈量数据,在这里可以剖析得到舌象13类55种特色、面象5类28种特色、脉象34类62种和中医体征症状62类363种,总计114类508种中医表型。
最有寻衅性的是生物电表型丈量平台和就寝监测中央的数据采集事情,测试前志愿者首先要完成洗头的程序,由于头发油脂的存在会影响脑电波的采集。在生物电表型丈量平台,事情职员会将一个分外的头套戴在志愿者的头上,上面有大量的数据线,然后哀求志愿者凝神静气地单独待上15分钟,但是这15分钟内不能打瞌睡儿。晚上7点旁边,志愿者们进入了就寝监测中央的房间中,这里的摆设和宾馆差别不大,唯一不同的是床旁有大量的数据线,睡觉前,事情职员会在志愿者的头部和身体其他部位安上大量的数据线,睡觉时不能动弹,无法翻身。如果半夜要起夜,有专门的呼叫系统,让事情职员过来拆除一部分数据线后,才能进入卫生间。完成一天的数据采集事情后,志愿者的身体还是比较疲倦的,在这个环节很快沉沉睡去,一觉到天明。
生理测试更像是闯关游戏,这些游戏磨练的是情景影象(对应脑部海马系统)、事情影象(背外侧前额叶系统)、冲动性(额下回系统)、持续把稳(背侧把稳力系统)、操持性(前额叶系统)、认知灵巧性(前额叶—纹状体系统),答题的结果与脑部表型的构造可能有对应关系。
在这次测试中,还体验到了航天员的报酬。这套检讨足跟部骨密度的测试仪是复旦大学信息科学与工程学院/人类表型组研究院他得安教授团队自主研发的,仪器已用于与中国航天中央互助的地星2号实验,取得了主要的科学数据。
顶尖科学家领衔
云集海内一流科研团队
不要鄙视表型组全景精密丈量的每个测试环节,这些看似大略的测试背后云集了中国最好的科研团队,每个领域都有顶尖的科学家领衔,都有一个专家委员会在进行研究,他们会推举测试仪器,制订测试和研究参数,代表了海内最高端水平。
罗竞春先容说,仅是影像学的检测方案就经由了上海各大三甲医院很多影像科主任的多轮打分和筛选,其存心程度可见一斑。看似闯关游戏的生理测试也是属于天下顶尖水平系列的测试。测试间参考了剑桥大学生理学专业实验室的设计,剑桥大学生理学专业居天下排名第一。相对付人工主持的测试,运用定量标准化的软件测试的偏差更小。隔间大小及高度、玻璃透明度、灯光等都有讲究。房间太大随意马虎分心,太小随意马虎有压抑感。打造隔间也是希望志愿者之间不要相互关扰。这个测试从不同的角度评价志愿者的认知能力,美国食品与卫生管理局授权这款系统的评测结果可作为认知功能干系药物研发的临床终点指标。
仪器和测试方法是一方面,但是要想得到空想和客不雅观的数据,还须要事情职员和志愿者之间的高度合营。在这个过程中,对付事情职员来说,是巨大的事情寻衅。为理解决这个问题,复旦大学人类表型组研究院多次约请专家对事情职员进行业务培训和礼仪培养,这里的事情职员都是技艺高超的多面手,也是让人有如沐东风、宾至如归感想熏染的高端做事者。
数据的采集和网络并不是检测的结束,这些数据还要被专家们核准一遍。这里最近还进行了一次高等专家的盲审和评估,最紧张的目的便是希望得到最准确的数据资料,提升后续科研事情的准确性。
研究成果正在显现
表型组研究转化成果值得期待
据先容,随着干系重大专项的开展和人类表型组大科学操持的本色性推进,中国科学界已经取得了一系列代表性成果。目前,复旦大学为主的团队已初步建立了人类表型组基本术语和丈量规范体系;在上海市重大专项支持下,大量的运用示范研究已经展开,个中就包括王久存教授团队紧张卖力的高原习服表型组研究。
王久存10年前就开始了高原习服表型组的研究事情,“我们想回答的问题是,为什么有的人很适应高原,有的人就完备弗成。我们已经创造了与高原习服干系的关键表型和表型之间的强关联,这种强关联在平原环境中无法探测,一定要在缺氧环境中才会显现出来,可以用‘牵一发而动全身’来形容,缺氧一涌现,一些人就会涌现血氧饱和度低落、呼吸加速、头痛等情形。”
王久存说,目前复旦科研团队已经画出了其背后的基因组学图谱、转录组学变革图谱、表不雅观组学变革图谱、蛋白组学变革图谱、代谢组学变革图谱、生化表型变革图谱等,初步找到了50多个研究指标,正在形成一套标准,为精准评估乃至未来预测普通人能否康健地去高原地区旅行、是否适宜长期在高原地区事情供应了科学依据。
“如果这些高原习服能力的多组学评估指标中有相称比例处于正惯例模,我们就可以剖断其适宜高原生活,如果差距很大,则须要一些药物干预。”王久存先容道。据悉,目前复旦大学人类表型组研究院的一支团队已经根据高原习服研究筛查到的一些有希望的靶点进行干系药物的研发。
本文系作者个人观点,不代表本站立场,转载请注明出处!