"数据只是成千上万个故事的总结--讲几个故事,让数据更有意义"。 - 奇普和丹-希斯
英国医学教育教授艾伦-布莱克利(Alan Bleakly)认为,有两种认知方式:科学和故事。传统的分析方法是描述性的,而故事的价值在于它的情感冲击力。换句话说,叙事为统计数据增添了灵魂。
当然,"大数据 "和机器学习已经在彻底改变医学。借助海量数据集,医学研究人员可以分析世界各地患者的病历,了解哪些治疗方法更有效,哪些无效。此外,在医学中利用分析技术还有可能降低治疗成本,预测流行病的爆发,避免可预防的疾病,并全面提高生活质量。
问题就出在这里。为了保护个人隐私,医疗数据通常都是去标识化的,即删除任何可用于潜在识别病人身份的敏感信息。
一方面,这完全合情合理。COVID-19 的经验表明,个人数据有可能被用来限制行动、公民自由或与执法部门共享。
但是,去身份化也会导致非人化。这意味着我们失去了人们经历的关键细节。当一个人的身份不复存在时,他就只能成为数据集中的一个点。
这就是讲故事的作用。当你需要深入了解人类行为时,这是一个至关重要的工具。
以癌症筛查为例:虽然数据可以告诉我们非裔美国妇女的乳腺癌筛查率很低,但通过焦点小组讲故事的方式可以帮助我们了解原因。例如,北卡罗来纳州的研究人员发现,由于来自家庭、媒体和医疗服务提供者的信息相互矛盾,以及认为癌症是 "白人疾病",人们普遍认为患癌风险低。我们还进一步利用讲故事的方式来消除错误信息,并让妇女了解筛查的重要性。如果仅靠去身份化的数据点,这些都是不可能实现的。
我们必须将科学与讲故事结合起来。尽管每个数据集都在讲述一个故事,但并非所有人都能参与其中。通过使用叙述或可视化的方式有效传达来自任何数据集的见解,以数据为主导的讲故事为弥合鸿沟提供了一种令人信服的方式。它将数据转化为能引起我们情感共鸣的感知,一种我们有能力欣赏的感知。
在错误信息充斥的时代,科学家必须积极向公众宣传他们的工作、工作的原因以及工作的重要性。
讲故事是一种工具,能让听众以更有意义的方式接触到复杂思想和概念的精髓,也能让那些经常被排斥在科学之外的群体更容易接触到科学,并将科学融入其中。
归根结底,你可以拥有尽可能多的数据,但如果你不了解这些数字背后的人,这些数据就毫无意义。