肖恩·钱(Sean Qian)说:“看到这种方法可以更好地预测早上5点以后的通勤流量,这真是令人兴奋,我相信这种方法可以迅速部署到我们的许多运输管理中心。” (信用: 快门转轮/ Flickr)
研究人员已经使用从推文中提取的信息来提供无与伦比的准确性,以预测早晨的交通方式。
通勤时间是一天中最繁忙的时段之一; 然而,事实证明,这也是预测流量模式最困难的时间。 这是因为大多数交通量预测方法都依赖于从导致时间到预测期的一致的交通量数据流。
但是,大多数人会花一些时间在他们之前 改判 在家里睡觉或早上做例行活动,在预测交通数据方面存在很大差距。
研究人员的方法通过从前一天晚上到第二天清晨之间发送的推文中提取数据来解决此问题。 他们首先使用Twitter的应用程序编程接口(API)来识别给定区域(在本例中为匹兹堡市)内的推文,并带有指示其发送来源的地理标记。 然后,他们使用了另一个名为Twint的应用程序,即网络抓取工具,该工具使用带有地理标签的推文从用户那里提取了其他帖子,以更好地反映该用户活跃的时间和范围。 在发布之前,所有数据都会被匿名化并删除任何个人身份信息。
“我们认为推文捕获了三类有用的信息,以解释第二天的早晨交通情况,其中包括人们的睡眠-觉醒状态,本地事件和(计划中的)交通事件,”土木与环境工程学副教授肖恩·钱(Sean Qian)说,钱的博士生姚伟然(Weiran Yao)写道。
该数据集的进一步扩充使研究人员能够提取其他信息。 通过语言分析,团队确定了可能表示交通事故的搜索词。 这不仅包括事故,还包括计划中的停业或大型活动,例如音乐会,体育比赛或节日庆典。
简单的个人推文,例如“在海盗游戏中大放异彩!” 或“前面的挡泥板弯弯机会让我迟到”,实际上可以提供关键信息,尤其是在贴有地理标签或来自该用户的其他推文中。 还从官方媒体(如新闻媒体和地方政府)中提取了进一步的数据,这些媒体经常在推特上发布有关事故和计划关闭的直接报道。
结合使用时,这些方法可提供大量信息,表明可能的地理分布和睡眠/唤醒时间 乘客,以及可能影响通勤的计划内交通事故和意外交通事故。 这弥合了通宵交通停顿造成的信息鸿沟。
有了这些信息,钱和姚就能够以前所未有的准确性提供匹兹堡早上上下班时段的交通预测,并创建了一个全面的框架来预测市区的早上交通状况 地区.
这些信息还使他们能够开始在更大的日常范围内进行观察和预测。 这包括发现匹兹堡的早上交通通常在星期二,星期三和星期四比较拥挤,这可以使运输机构更好地管理早上的通勤。 由于无法准确预测早晨的状况,这种观察以前是不可能的,可能会在旅行需求管理,信号定时控制和个人目的地路线选择方面做出更大的决策。
钱说:“这项研究利用机器学习和大数据来理解人类行为,同时保护个人隐私。”
“看到这种方法可以更好地预测早上5点之前的通勤流量,这真是令人兴奋,我相信可以在我们的许多运输管理中心中迅速部署这种方法。”
作者简介
相关书籍:
原子习惯:建立良好习惯和打破不良习惯的简便方法
由James Clear
Atomic Habits 基于对行为改变的科学研究,为养成好习惯和改掉坏习惯提供实用建议。
四个趋势:不可或缺的性格特征,揭示了如何使您的生活变得更好(以及他人的生活也变得更好)
通过格雷琴·鲁宾
四种倾向确定了四种人格类型,并解释了了解自己的倾向如何帮助您改善人际关系、工作习惯和整体幸福感。
再想一想:知道你不知道的力量
通过亚当·格兰特
Think Again 探索了人们如何改变他们的思想和态度,并提供了改进批判性思维和决策制定的策略。
身体保持得分:创伤治疗中的大脑,思想和身体
作者:Bessel van der Kolk
The Body Keeps the Score 讨论了创伤与身体健康之间的联系,并提供了关于如何治疗和治愈创伤的见解。
金钱心理学:关于财富,贪婪和幸福的永恒课程
通过摩根豪塞尔
金钱心理学研究了我们对金钱的态度和行为如何影响我们的财务成功和整体福祉。