计算机如何知道你在看哪里？ -InnerSelf.com

: By 德克萨斯州农工大学安·麦克纳马拉（Ann McNamara）

感谢造访 InnerSelf.com，哪里有 20,000+ 宣传“新态度和新可能性”的改变生活的文章。所有文章均翻译为 30多种语言. 订阅每周出版的《内在自我》杂志和玛丽·T·拉塞尔的《每日灵感》。 InnerSelf杂志 自 1985 年起出版。

计算机如何知道你在哪里看？

想象一下驾驶汽车，在挡风玻璃上使用抬头显示器投影，在不熟悉的城市中航行。这是增强现实（AR）; 这些信息不仅用于引导您沿着路线行进，还可以提醒您周围环境中的重要信息，如骑自行车的人或行人。虚拟内容的正确放置不仅是至关重要的，也可能是生死攸关的问题。

信息不能掩盖其他材料，应该显示足够长的时间让你理解，但不能太长。计算机系统必须实时做出这些决定，而不会导致任何信息分散注意力或造成冲突。我们当然不希望有一个骑自行车的人要穿过车前，让自己模糊不清！

作为AR的研究人员，我花了很多时间试图弄清楚如何在恰当的时机恰到好处的把握正确的信息到用户的屏幕上。我了解到，显示太多的信息可能会使用户感到困惑，但是显示不够则会导致应用程序无用。我们必须找到两者之间的甜蜜点。

事实证明，这个关键要素就是知道用户在看什么。只有到那时，我们才能在他们可以处理的地方提供他们想要的信息。我们的研究涉及测量哪里用户正在寻找真实的场景作为帮助决定放置虚拟内容的方式。随着AR准备渗透我们生活的许多领域 - 从驾驶至工作至休闲用品 - 我们需要解决这个问题，然后才能依靠AR为严重或重要的行动提供支持。

确定在哪里放置信息

有信息显示在用户正在寻找的地方。在导航时，用户可以查看建筑物，街道或其他实物以揭示相关的虚拟信息; 系统将知道隐藏所有其他显示器以避免混乱可见的场景。

但是我们怎么知道某人在看什么？事实证明，人类视觉的细微差别使我们能够在一个人的眼睛和背景中进行审视计算他们在哪里看。通过将这些数据与显示一个人的视野的摄像机配对，我们可以确定该人正在看什么以及他或她正在看什么。

眼动追踪系统首先出现在1900中。最初他们主要是用来研究阅读模式; 有些可能会对读者非常干扰。最近，实时的眼动追踪已经出现，变得更实惠，更容易操作和更小。

眼睛跟踪器可以连接到屏幕或集成到可佩带的眼镜或头戴式显示器。眼睛跟踪使用的组合相机，投影和计算机视觉算法计算眼睛和注视点在监视器上的位置。

我们在检查眼动数据时通常会考虑两个措施。第一个被称为a 固定术，用来描述当我们暂停我们的凝视时，往往在一个场景中的一个有趣的位置，因为它引起了我们的注意。第二个是扫视，用来定位凝视的快速眼球运动之一。紧随其后的是短暂的移动，被称为扫视。基本上，我们的眼睛迅速地从一个地方到另一个地方收集关于场景的部分信息。然后我们的大脑把这些注意力的信息放在一起，形成我们心中的视觉形象。

{youtube}tdFIvRMvFQI{/youtube}

眼动跟踪与AR结合

通常AR内容被锚定到真实世界的对象或位置。例如，应在该街道上显示包含街道名称的虚拟标签。理想情况下，我们希望AR标签看起来接近它所关联的实际对象。但是我们也需要小心，不要让多个AR标签重叠，变得不可读。管理标签放置有许多方法。我们正在探索一个选项：计算人物在真实场景中的位置，并仅在该位置显示AR标签。

例如，说一个用户正在与一个移动应用程序进行交互，以帮助他在杂货店购买低卡路里的谷类食品。在AR应用程序中，每种谷物都有与之相关的卡路里信息。用户可以拿起他的移动设备并将其指向特定的麦片盒，以显示相关信息，而不是拾取每个麦片盒并阅读营养成分。

但想一想商店的谷物过道是如何挤满各种包装的。如果没有一些方法来管理AR标签的显示，将会显示所有谷物盒子的卡路里信息标签。要确定他感兴趣的麦片的卡路里含量是不可能的。

通过跟踪他的眼睛，我们可以确定用户正在看哪个谷物盒。然后我们显示特定谷物的卡路里信息。当他把目光转向另一个盒子时，我们会显示他所考虑的下一个数字。他的屏幕整洁，他想要的信息是随时可用的，当他需要额外的信息时，我们可以显示。

这种发展使得AR研究成为一个激动人心的时刻。我们在移动显示器上将真实世界的场景与计算机图形相结合的能力正在提高。这促进了创造令人惊叹的新应用程序的前景，这些应用程序扩展了我们与周围世界互动，学习和娱乐的能力。