人类疾病数据库MalaCards

全球疾病负担(GBD)数据库——这个被WHO、国家卫健委当决策底牌的免费神器,90%的人却不会用

说实话,当我第一次接触GBD数据库时,我还是相当震惊的。
当时我在疾病预防控制中心实习,对非洲某国疟疾数据不完整感到担忧。
我突然发现IHME直接把1 9 9 0年至今的所有数据都贴出来了。
它还被细分为非常详细的类别——按年龄、性别、地区,甚至还有中美心血管疾病负担的比较图。
这很有趣,因为以前我做跨国比较时,必须从N个不同的来源找到数据,当我拼凑起来时,往往不准确。

例如,我使用 GBDCompare 可视化工具在几分钟内创建了全球结核病负担地图。
红色突出的区域特别引人注目,也证实了我们在上次会议中讨论的内容:“东南亚是否应该增加投资?”我没有深入研究GHDx数据仓库,但听隔壁做深度分析的家伙说,他们将GBD数据与当地医院记录进行交叉引用,发现某个地点肝癌死亡率的统计误差可以纠正2 0%左右。
这让我意识到开放数据不仅仅是IHME的善举,而是能够真正解决实际问题的。

说到典型应用,给我印象最深的是中国高血压防治的案例。
在GBD报告发布之前,我们一直认为高血压的防治是慢性病中最被忽视的领域。
结果报告直接指出“中国高血压死亡人数位居世界第一”。
数据还包括一个时间趋势图,显示这个数字从1 9 9 0年开始一直持续增加直到今天。
该省现已放宽拨款,将免费筛查纳入所有公共卫生服务。
这让我明白了,好的数据有时比好的口才更有效。

但是对于GBD数据的使用还有一点小知识。
我有一位专门从事代谢疾病研究的同事。
他首先直接应用YLL来计算糖尿病负担,但结果与临床观察结果存在显着偏差。
后来我了解到GBD的YLL计算是根据平均寿命计算的,但糖尿病的真正影响是降低生活质量。
仅看损失的生命年数绝对是被低估的。
因此,现在他们正在分析国家数据并添加额外的患者生活质量评分,以使结果与临床经验一致。

现在我们部门的新人都学习Python来调用API。
一位年轻医生写了一个脚本,可以自动抓取指定国家指定疾病的时间序列数据,直接生成折线图,并发送给微信公众号。
IHME的API文档其实很清楚。
关键是人能不能用。
他们还要求合作定制农村地区的数据分析中国。
虽然IHME最终没有满足所有需求,但沟通过程本身也为数据解释提供了很多思路。

归根结底,GBD数据库就像一个宝藏,但你需要知道挖掘它的工具。
仅仅会读卡是没有帮助的,你还需要知道 DALY 和 YLL 之间的算法差异;仅仅能够使用Python来抓取数据是不行的,需要因地制宜地进行修正。
IHME的开放是好事,但使用它的人需要懂得欣赏:不要只关注流行病,欠发达地区的罕见病数据其实更值得探索。
我在这方面经验很少,但我认为 GBD 数据最吸引人的地方在于,它将全球健康的不平衡问题摆在你面前,迫使你思考如何利用有限的资源来做一些严肃的事情。

全球疾病负担数据库