尽管已经经历了工业革命,19世纪的英国对于公共卫生的重视还远远不够,各种烈性传染病时有发生。1840s末期,伦敦又爆发了严重的霍乱疫情,不少人死去。
当时主流的理论认为霍乱是靠“肮脏的空气”传染的。但是又怎么可能识别和隔离“肮脏的空气”呢?所以当时对霍乱的预防其实是毫无办法的——理论的误导太严重了。一个年少有为的医生,John Snow,这时已经是伦敦皇家外科医学院和伦敦皇家内科医学院的双料成员,盯上了这个问题。他不太相信空气传播霍乱的说法,认为水里携带的细菌才是主因。他用几年时间,走遍伦敦进行调研和病情记录,绘制了一系列的点图。比如:
从图中可以清晰看到,霍乱的发生跟地点的关系很大,呈中心发散型。这就很大程度上挑战了“空气传染”说,因为如果是空气传染的话,霍乱的发生应该是比较均匀的才对。同时这个研究也提供了很强的证据支持霍乱是水传播的。就在图的中心,Snow将传染源锁定为一个公共抽水机(从被污染了的泰晤士河里取水),并说服政府将抽水机挪走。尽管这个研究后来还有一些波折,这里按下不表,无论如何,Snow的工作大大开拓了当时的研究视野。
这就是Snow锁定的抽水机,现在已经成了一个地标:
这就是早期的最有影响力的spatial analysis的研究!从中可以受到启发,关键的是两块信息:
(1) 某个outcome (eg 霍乱的发生)
(2)地理位置
这个outcome可以千变万化,疾病发生率,死亡率,收入水平,就业率,入学率等等。地理位置也可以上至大洲大洋,下至左邻右坊,可以是单中心,也可以多中心,可以有不同类型的分布,不同的方差,等等等等。当信息量超过一定程度,就需要更好用的数学模型,更有效率的算法,更强大的硬件……所以这个领域能结合各学科知识,能重新诠释很多问题。就像课上老师说的:given enough ata,with spatial analysis you coul act like a Go!
我们已经得到了一个信息:疾病的发病率跟地理位置是相关的,所以spatial analysis在生物统计方面应该是大有用处的。但是以前这方面的研究很少,没别的,就是缺少数据。
做isease mapping是统计学和公共卫生交叉的一个未来研究趋势,在北美已经做了不少了,中国在这一块潜力很大。
北美的isease mapping开始得早,所以应用的也早。比如加拿大的British Columbia省,就有这个很好的官网:iMapBC
在网页地图里选择某种outcome(比如心脏病),很快就会显示这个outcome在各地的发病率是多少,非常直观,很容易看到跟location的关系,从而有助于政府制定相关的预防措施。
2.目的。我们能用isease mapping干什么?
了解疾病在各地的发生
预测各地的疾病发生率
测量地区之间在疾病发生率上的差异
总结数据的“pattern”,看看有什么规律没有
这一切都是为了能够更好的评估各地的health service outcome,从而将有限的资源更加合理地分配,实现最大化的效用。比如蒙古和卢旺达在Ebola上的发病率肯定是显著不同的,联合国要援助,显然是要先援助卢旺达。但是卢旺达和纳米比亚相比?这就需要更加精细的spatial analysis了
3.未来发展的方向。
随着更先进的卫星、更庞大的监测体系、更长跨度的跟踪,我们会有更加丰富也更加复杂的数据,体现在:
Areal ata:现在往往是以省、市为单位做Bayesian spatial analysis,将来一定囊括比现在更广阔的地区;
Multilevel ata:现在基本是三级数据已经很难得,将来的数据会有更多的层级;
Dynamic ata:现在的数据还基本是静态数据,将来也许会容纳很多的动态数据,来反映即时的位置变化和状态变化。
【微语】愿你走出半生,归来仍是少年。愿你留学一遭,回首有爱相伴。