2015-05-05 21:39:56来源:中国循环杂志阅读:39次
上海海事大学交通运输学院Zheng Wan教授最近在《自然》杂志吐槽了他的苦闷,也表达了自己对Google学术搜索引擎的喜爱和怀念。
当然作为一名科学家,他并不会仅仅浅薄地停留在这个段位上,而是对这些问题也做了深入的剖析。
人们喜欢称这个时代为大数据时代,因为各种数据库的发展、共享已经达到前所未有的境地,而且数据的开放也为中国科学家登上国际竞争舞台起到一臂之力。
所谓一臂之力,显然不是全力,Wan教授认为这是因为在中国社会,围墙文化已经渗透进公共数据获取和分享上,各种限制如栅栏一样,隔断了科学家和数据的亲密接触,最终拖了科学研究和创新的后腿。
“中国科学工作者获取高质量国内数据正在变得越来越难了。”他感叹说。
他介绍说,大多公共数据被政府部门牢牢抓在手中,连研究者获取信息都变得困难。这不仅难为了人文社科领域的研究者,由于数据的一些政治敏感性,环境科学、公共健康领域的研究者也落入了难为的窠臼。
他在会议上就听到很多同事的抱怨,说他们从权威部门获取空气污染数据是多么得难。
除了数据被垄断外,Wan教授们还受到公开数据的其他困扰。
他介绍说,一些公开的数据很可能因为采集方式的问题而存在质量问题,比如人们对国内生产总值(GDP)的各种议论纷纷。官方的全国性的GDP估值,与将31个省级区域的地方值相加的总和相比,存在极大的差异。北京的国家统计局承认,不同省采用不同的数据采集方式导致了这一结果,而他们正在试图协调这个问题。但至今,进展不容乐观。
此外,公共数据也俨然变成了香饽饽,从而分享也变成了一种盈利。Wan教授带着几分悲愤谈了一下他在采集分析道路车辆对于污染的影响的过程。
他说,对于研究机构来说,想要从官方获取最基本的车辆持有辆的信息都十分困难,所以只能退而求其次地使用来自汽车制造商的销售数据,而这样的数据经常是被夸大的、带有误导性的。而财大气粗的汽车制造商们却可以从政府相关渠道购买到他们竞争对手的客观可靠的销售数据。
在这种不良环境中,中国的一些研究团队不愿意公开他们自己的研究数据也就不奇怪了。因为,掌握数据意味着在学术领域拥有了无形的资本和竞争优势。不过Wan教授表示,要是从其他渠道能获得高质量的数据,他们也会乐意分享他们自己的数据。
Wan教授认为,作为信息流通和获取的网络,其安全肯定是对国家安全很重要的,但是要想推动科学快速健康发展,数据的客观、公开、透明也是极其重要的。“资源共享信息的开放可以巩固经济和社会幸福。”他说。
比如2014年环保局迫于公众压力而全面公开披露空气污染数据,要知道在此之前,这类数据只是粗略地每天公布一次。而现在,数据每小时都更新一次并且在国内政府机构之间广泛分享。当前这种数据的发布,不仅帮助小朋友们远离雾霾,也加强了交通运输局能够调整汽车限行政策。抑或也增强了公众对于日益恶化的污染的危机意识。
公众数据如何更好地开放? Wan教授认为,在中国解决这些问题尚需进行全面研究,从而建立一套有利于多方的高效合理的数据管理机制。更迫切的是,研究者们应当被给予更大的权限,特别是对于公共数据和学术搜索引擎。不论如何,实现公共数据的全面透明公开还是有很长的路要走。
来源:China’s scientific progress hinges on access to data. NATURE, 2015, 520:587.
转载:请标明“中国循环杂志”