使用这些词语的Facebook帖子可以预测抑郁症

研究人员创建了一种算法,可以分析社交媒体帖子,找到抑郁症的语言标记。

在任何一年中,抑郁症影响美国超过6%的成年人口 - 一些16万人 - 但只有不到一半的人接受他们需要的治疗。

研究人员发现,他们的算法可以准确预测未来的抑郁情绪,分析同意用户在导致抑郁症诊断的过程中共享的社交媒体数据。 这种情况的指标包括提及敌意和孤独,像“眼泪”和“情感”这样的词语,以及使用更多第一人称代词如“我”和“我”。

调查结果出现在 诉讼中的国家科学院院士.

你的社交媒体“基因组”

“人们在社交媒体和网络上写下的内容捕捉到生活中的一个方面,这在医学和研究方面非常难以获得。 与疾病的生物物理学标志相比,这是一个相对尚未开发的维度,“Stony Brook大学计算机科学助理教授,高级论文作者H. Andrew Schwartz说。 “例如抑郁症,焦虑症和创伤后应激障碍等疾病,你会发现人们以数字方式表达自己的方式有更多的信号。”

六年来,位于宾夕法尼亚大学积极心理学中心和斯托尼布鲁克人类语言分析实验室的世界福祉项目(WWBP)的研究人员一直在研究人们使用的词汇如何反映他们的内心感受和满足感。 在2014,WWBP创始研究科学家和宾夕法尼亚大学博士后研究员Johannes Eichstaedt开始怀疑社交媒体是否有可能预测心理健康结果,尤其是抑郁症。


内在自我订阅图形


“社交媒体数据包含类似于基因组的标记。 与基因组学中使用的方法惊人地相似,我们可以梳理社交媒体数据以找到这些标记,“Eichstaedt解释说。 “抑郁症似乎是以这种方式可以察觉的东西; 它确实改变了人们对社交媒体的使用方式,其方式就像皮肤病或糖尿病一样。“

写在Facebook墙上

研究人员从同意分享Facebook状态和电子医疗记录信息的人员那里找到数据,然后通过机器学习技术分析这些状态来区分正式抑郁症诊断。

“这是来自宾夕法尼亚医学数字健康中心的社会Mediome注册处的早期工作,它将社交媒体与健康记录数据结合起来,”研究合着者Raina Merchant说。 “对于这个项目,所有人都同意,没有从他们的网络收集数据,数据是匿名的,并且遵守最严格的隐私和安全级别。”

然后,几乎1,200人员同意提供两种数字档案。 其中,只有114人在其病历中诊断为抑郁症。 然后,研究人员将每个人与抑郁症的诊断相匹配,其中五个没有,作为对照,对于683人的总样本(不包括状态更新中的不足单词)。 我们的想法是创建尽可能逼真的场景来训练和测试研究人员的算法。

“人们认为使用社交媒体不利于一个人的心理健康,但它可能会成为诊断,监控并最终治疗它的重要工具。”

“这是一个非常难的问题,”Eichstaedt说。 “如果683的人到医院就诊,而15的百分比是抑郁的,那么我们的算法能够预测出哪些? 如果算法表明没有人被压抑,那么85的准确度将是百分之一。“

为了构建该算法,研究人员回顾了524,292 Facebook的更新,这些年来导致每个患有抑郁症的患者的诊断以及控制的相同时间跨度。 他们确定了最常用的单词和短语,然后将200主题建模为他们所谓的“抑郁相关语言标记”。最后,他们比较了抑郁与控制参与者使用这种措辞的方式和频率。

抑郁症诊断的“黄旗”

他们了解到这些标记包括情绪,认知和人际关系过程,如敌意和孤独,悲伤和反刍,并且可以在医疗记录中首次记录疾病之前三个月预测未来的抑郁症。

施瓦茨说:“人们认为使用社交媒体不利于一个人的心理健康,但它可能会成为诊断,监控并最终治疗它的重要工具。” “在这里,我们已经证明它可以用于临床记录,这是通过社交媒体改善心理健康的一步。”

Eichstaedt认为使用这些数据作为一种不引人注意的抑郁症诊断筛查的长期潜力。 “希望有一天,这些筛查系统可以整合到护理系统中,”他说。 “这个工具引起了黄旗; 最终,希望是你可以直接将人们的信息汇集到可扩展的治疗模式中。“

尽管该研究存在一些局限性,包括独特的城市样本,以及该领域本身的局限性 - 并非医学记录中的每个抑郁症诊断都符合结构化临床访谈提供的黄金标准,例如 - 这些发现提供了一种潜在的新方法来揭示并为那些患有抑郁症的人提供帮助。

Sumber: 纽约州立大学石溪分校

相关书籍

at InnerSelf 市场和亚马逊