厂房出租 • 产业园区招商 • 企业选址平台

全国客服热线

4000781099转1001

当前位置: 中工招商网 > 资讯首页 > 人物观点 > 王伟业: 信息时代下的生物样本库

王伟业: 信息时代下的生物样本库

发布时间:2015-01-15 来源:中工招商网 1187

  美国RAND公司的研究报告指出,本世纪初美国生物银行存贮的人体组织样本数量超过3亿份,并以每年2000万份的速度增加。而我国的国家基因库也拥有3000万份人、动植物和微生物样本,被认为是世界级的生物样本库和组学数据库。

  在如今这样的信息时代下,这些数量庞大的数据有什么作用?打个比方,数据就像沙子,单个来看,也许毫无价值可言,没有技术辨别、提纯的时候,它们就是一盘散沙;但是当数据量足够大,并且有技术能够把它们利用起来,这些数据的价值就会急剧上升,犹如沙子变成了黄金。生物样本库与信息化管理的有序结合,将为生物样本库创造新的价值。本次生物谷有幸请到了即将参加2015(第二届)生物样本库与临床研究论坛的上海交通大学医学院附属新华医院的王伟业教授,看看他对于生物样本库信息化有怎样的看法。

  移动医疗大发展的背景下,生物样本库的信息化有着怎样的发展基础?

  王伟业教授:生物样本的价值是离不开与其密切相关的所有信息,其中个人生活信息和临床表现信息虽然比较直观,想象中可能比较容易获取,其实可能不那么容易获得配合或反映真实情况的信息,或言人为因素较多的信息, 造成信息缺乏或质量不高。这方面的信息可以反映样本来源的特性或特征,对与临床研究结果分析极为重要。最常用方法是通过问卷方式需要被询问这提供答案来获取相应信息,这就必然涉及许多因素,比如询问的环境与时间,对象是否愿意或对提供信息是否有兴趣,提供者是否有耐心等,会直接影响信息的质量:真实性和全面性。另外这样的信息通常需要长时间的随访,被询问者的依从性成为是否能够长期随访的关键。我今年在英国参加国际学术会议期间,专程拜访目前世界上最大的英国生物样本库(UK Biobank)时,给我一个比较深的印象是参加者(志愿者)会定期从各地乘火车到曼切斯特城(英国样本库所在地),到现场的计算机上输入自己在家里回答的问卷信息(用U盘的方式),并在现场进行相应的检查观察。我特别就此问题询问接待我们的负责人,同时还玩笑说这些来的人可能都是上了年纪的人,比较有时间(调查对象为40-69岁人群),不否定与年龄组可能有些相关,但是参加者的配合性也是令人印象深刻(研究方只提供报销路费)。我国此类方面的研究面临的配合方面的问题可能多些,配合或随访的依从性往往是比较显著的问题。要想提高这方面信息的质量,应用移动医疗手段获取此类信息,比如可穿戴的移动设备等,相信是一个比较有效的方法之一。上海交通大学医学院附属新华医院崇明分院采用手机终端的APP,"疼痛智能管理系统"来获取信息和及时管理患者的疼痛就是移动医疗信息收集与样本信息化的一个很好实例。由上海市崇明新华癌痛转化研究所丁罡教授领衔的项目组在临床管理病人临床疼痛症状过程中,考虑到患者不遵医嘱服用痛药物的行为普遍存在,同时由于医生缺乏对患者服药疗效进行实时评估和随访的有效工具,无法规范医嘱的落实,保障患者的最佳治疗效果。另外,疼痛评估是主观的、动态变化,疼痛的性质也随着病理生理状态的变化而改变, 但临床上仍然缺乏有效的随访工具对患者的疼痛治疗效果进行实时评估。为此,丁罡教授的项目组自主研发了手机终端的"疼痛智能管理系统"为患者提供更加合理的管理。患者每天通过智能手机界面上的疼痛管理模块,将他的状况实时反馈给临床医生,这样就可以移动管理病人,更可贵的是收集到真实的信息,而且病人的配合非常好,丁罡教授曾经对我说过患者的依从性非常好,也出乎他意料,有利于长期随访,所以移动医疗帮助收集信息,而且全面与长期性很好,这样的信息注释到相应的样本,加上由此分析研究的实验室信息,能够很全面的描述样本的特征并应用与进一步深入的研究。另外,这样收集的数据省时间,省人力和相关成本,比当面以询问时获得的信息会更可靠,在自己熟悉的环境和合意的时间提供信息,这也就是样本库信息化追求的目标:从样本信息化(Sample Annotation) 到 信息化的样本库(Annotation of Biobank )。

  临床信息与样本信息整合有利于样本信息化,你认为目前这方面的主要问题是什么?

  王伟业教授:我认为主要问题可概括为三个方面:(1)由临床获得的信息只是非常简单的信息,结果仅仅是省些人工而已。这种现象表现为样本库信息系统与临床连接,输入病人住院号,其他相关的登记信息自动进入样本库系统,这些信息对样本库管理可能有些用,但对样本特性表达需要的信息化几乎还没有任何联系;(2)可能比较盲目地获取临床的所有信息,信息太多,但缺乏明确的信息内容指南。这种方式是将临床系统中的大部分信息自动输入样本库系统,储存在新建的一些表格中,可以通过报告的方式展示一个人的详细临床信息。这样的信息输入操作两个大的问题:一方面只是针对某一个人的详细报告而已,也仅仅是复制新的储存位置,另一方面,这样的信息结构并不能够在样本库中得到应用--查询需要的样本和/或人。因为样本库的应用困难而造成信息整合的浪费;(3)缺乏设计,主要原因是没有设计样本信息需要的数据元素和相应的数据集,尤其是整合的信息没有正确地应用到样本库的工作。比如心血管疾病,糖尿病,高血压和肿瘤等需要这些临床信息合理地描述样本或受试者的生物特性,尤其是不同疾病信息之间的相互联系,比如糖尿病会增加心血管疾病风险,糖尿病同时合并高血压的机率增加,而心血管疾病又是糖尿病人死亡的主要原因等,充分说明疾病之间的相关性,简单点说,就是需要是如何找到既有糖尿病,也有心血管疾病的样本和/或患者,这是一部信息化的基本要素。另外最基本也是最重要的结果是要能够应用到样本库的查询之中,找到研究者需要的特异性的资源,通过归类与区别资源获得需要的样本。

  促进样本库之间的合作,你认为最基本应该如何做起?

  王伟业教授:样本库之间的合作主要是资源整合应用以及多学科的结合研究,我认为最基本的一个需求就是同源样本应该有相同的信息内容,是指不同样本库的样本具有相同的数据集来容纳信息,以保证不同样本库的样本能够进行相似性作比较分析,将符合要求的资源进行合理整合。由于我国生物样本库建设还处于初期阶段,各个样本库的设计,信息收集和管理方式方面的异质性较大。同源样本比如糖尿病资源,可能合并有心血管疾病。糖尿病是心血管疾病高风险因素,糖尿病患者患心血管疾病风险性要比人群高2-4倍,而心血管疾病是造成糖尿病患者死亡的首要原因。另外糖尿病患者同时合并有高血压的风险又是正常血糖人群的2倍多;糖尿病人更容易发生心脏病发作或中风,而且预后也差等特点。在这些同源样本有不同信息内容的心血管疾病或肿瘤样本资源如果简单整合应用,可能人为地产生"非同源性"样本。总而言之,要先统一的要整合的信息内容,归纳其具有相似的生物特性后,排除不合适的样本,能够合理地做信息交流,比较分析后才能够确定真正的同源性。

  BIMS系统的接下来的主要发展和研究方向是什么?

  王伟业教授:我刚刚完成新版BIMS的设计构思,并与合作团队完成初步的计划,并已经开始实施。我就简单地称为新一代BIMS即NG BIMS。12月14日山东青岛举办的全国首个省级生物样本库分会成立大会的报告中我初次诠释了BIMS的理念和含义: BMIS并不是如字面上反映的那样(Biobank Information Management System), 而是强调样本信息化的主题,即Biological Information Makes Samples。既进一步强调样本的真正价值在其内涵的信息,研究的目的是挖掘出其中的信息即为样本价值。

  NG BIMS主要不是改变原有的管理流程,而是作深一步的设计,使其变得更加灵活,新设计反映主要部分可以归纳为:(1)多样化,(2)模板化、(3)个性化,(4)信息化,(5)电子表格, (6) 图形化六个大方面。

  BIMS目前面临的最大问题是缺乏用户管理界面,需IT人员进行修改,既费时又不方便,不利于使用者根据自己喜好而调整。多样化的基本目的是把系统调整权利交给使用者,根据管理的喜好来重新"打扮"(设置)系统;我国的样本库建设处于初期,样本库专职管理人员的专业性需要时间的积累,目前样本库的管理,尤其是信息收集等方面有些随便或多样,完全根据自己认为的需求做,这样造成样本库之间原有的差异性(Heterogeneity)变得更大,非常不利于我们常常听到的信息整合与共享。另一方面,样本库管理也需要一些引导,将各种疾病资源信息化内容根据相关专家的专业特长设置为专业管理模板,例如肿瘤病人登记和信息收集的数据元素和数据集等,不同样本库之间确定对同源样本(来源于同一种疾病的样本)的信息化内容时,能够从已经确定的系统导出(Export)某个数据集的模板,直接导入(Import)需要的样本库系统,这样逐步缩小样本库之间同源样本中信息化方面的差异性,为信息统一的可能性铺路;虽然工作流程要求下一步启动前必须等上一步完成之后,比如样本收集项目需要审核流程,但有的样本库不一定要审核批准步骤,NG BIMS的个体化体现在让使用者根据需要来减少或增加任何一个工作流程中的步骤;虽然各种交流形式中多次讨论过使用规范化的受控词汇方法来提高样本信息的统一性(Data Harmonization)以促进样本信息化(Sample Annotation), 但是BIMS目前还不具备能够接受层次结构的受控词汇,比如Taxonomy, Ontology。为能够进一步鼓励和推动本信息化,为样本库之间信息交流共享铺路,目标是逐步强化必要的样本与数据标准。NG BIMS将在系统中建立能够整合层次结构的受控词汇,最基本的受控词汇将从临床诊断的ICD-10 或SNOMED-CT开始;另外,样本库信息系统面临的挑战之一是样本与信息登记表或受试者注册表的多样性,所以根据临床实际的信息表格在NG BIMS中定制想要的电子表格,这将会给使用者带来方便和满足个性需要;图形的直观性对于样本库管理者在管理过程中分析、讨论和监控样本都是非常有利的,比如在办公室里面可以通过图形了解样本库储存设备以及其中的样本分布,工作流程中各种报告以图形的方式展示等。另外还有系统数据表格数据表拆分设计一方面有助于数据库的管理,也更有利于加快系统运作的速度也都是NG BIMS的新体验。总之,NG BIMS在增加个性和灵活性同时,还是在逻辑上有规范化的控制,做到既灵活多样,但是也要服从基本的统一和规范。

  王伟业教授即将参加2015年1月22日 在上海举办的2015(第二届)生物样本库与临床研究论坛,就我国生物样本库建设及应用领域的发展进行更多的探讨和交流。详情请关注生物谷后续报道。

  关于王伟业

  教授,美国M.D.Anderson肿瘤研究中心生物化学与分子生物学博士,生物信息研究与信息化管理专家。作为跨学科专业人士于2012年引进回国,任职于上海交通大学医学院附属新华医院,担任环境与儿童健康上海市和教育部重点实验室教授,副主任和新华医院生物样本库主任。多年来先后在美国M.D. Anderson Cancer Center,Baylor College of Medicine,Wyeth Research和Medical College of Wisconsin等科研机构从事生物医学研究,近年来主要从事生物样本库建设和信息化管理方面的工作,同时受聘为上海交通大学医学院转化医学研究院"985工程"生物样本库建设首席咨询专家,指导多家生物样本库基本的建设工作。目前的研究工作重心为生物医学科研信息和生物样本库信息化发展,促进资源信息共享。王教授领导的IT合作团队在较短时间内启动了几个信息化项目的研发,已经成功完成的生物样本库信息化管理系统(BIMS系统)已经在多家样本库建设和管理者发挥作用。另外,王教授领导的两项信息化科研项目已经分别获得上海科委创新国际合作项目和国家国际科技合作专项的经费支持,探索应用统一多方数据元素的方法和数据屏蔽技术,建设信息共享机制和运作模式,促进国内国际合作研究以及是样本资源的共享建设,为领域的领军者之一。

返回列表

分享到: