2015-11-04 17:23:17来源:中国循环杂志阅读:15次
大数据时代无可争议地来临了。
在长城会大数据论坛上,辉瑞中国医学部的谷成明博士指出,大数据的特点之一是“规模巨大且持续高速增长”。而且,“大数据能够让我们看到以往看不到的东西,回答临床研究回答不了的问题。”
他说,“大数据的另一个特征是数据收集、数据清理、数据分析方面的变化”,比如使用拍照扫描自动识别技术,可以帮助医生收集院内院外的数据,减少大量的人工录入需求,而且患者可看到自己的危险因素,控制情况,提高治疗的依从性。”
来自美国辉瑞公司的MarcBerger教授则说,大数据分析最需要“数据能充分发挥其外部性,并通过与某些相关数据交叉融合,才能产生巨大价值。”
而且,“只有通过比较,才能展现其魅力。” 比如有研究通过比较不同国家的数据,发现中国高胆固醇患者诊断率和认知率之低,让人触目惊心。
为此,辉瑞公司总部购买了许多巨大的商业医疗数据库,可供有兴趣的专家进行中外对比研究。但这也是有门槛的,因为这种数据“通常需要临床专家、统计专家、公共卫生专家及大数据分析专家等合作,才能更好应用大数据,造福于患者。
对这一观点,来自IBM中国研究院的谢国彤表示,随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多,因此,很多数据可能没有实际意义,甚至是“欺骗性的”,对此,从专业角度出发,避免制造“噱头”很重要。
另外,在大数据论坛上,几位讲者共同说的一点是“garbage in,garbage out”,这是统计学专家的口头禅,意思是说,“扔进去垃圾,出来的也是垃圾”。
这一方面是说建立数学模型要洞察问题的内在本质和症结,而非数字游戏;另一方面,也提示数据的倾向性问题,这其实也是大数据分析面临的“数据来源方面”的挑战,即应用客观而真实的数据找到症结所在;当然,数据质量问题也是要考虑的问题。
2012 年,《哈佛商业评论》报道,“数据科学相关工作是‘二十一世纪最性感的工作岗位’。”
但这个性感是什么,谷成明认为是“大数据的全新的思维和方式,尤其是思维模式的改变。”。
“我们有时不是追究事情的因果关系和理论的推导,而关注是否‘相关’,因此大数据回答的‘怎样’,而不是‘为什么’。”
比如,一项研究发现对于糖尿病患者需要治疗血脂异常患者,72%的患者选择了阿托伐他汀治疗,87%的患者病情明显改善,原因可能有很多,但数据真实反映了医生对于个性化选择方案的良好结果。
从科研方面,谷成明表示,大数据颠覆了“观察—假设—实验—应用”的科研流程。不是先有假设,再开始试验。
“我们可以先提出问题,马上就找答案。” 谷成明说。
当然,大数据的真实价值还是海洋中的冰山,现在看到的只是冰山一角。
我们该怎么做?用MarcBerger教授的话来说,“要么去改变,要么被改变”。
转载请标明来源:中国循环杂志
关于非法网站冒用我刊名义进行征稿的特别提醒
近期我们发现一些网站冒用“中国循环杂志”名义征稿,并承诺“职称论文权威快速发表”。
我刊郑重提醒各位作者,向《中国循环杂志》投稿,一定要登录中国循环杂志官方网站
http://www.chinacirculation.org
进入“作者投稿”,在“作者投稿管理平台”中投稿。
本刊联系电话:010-68332599、010-68331146、010-88396014。