
龙爪槐守望者: 鼠标指针已经被发明好多年了也没什么变化,这次终于要用AI重新定义了。谷歌这次提出来的魔法指针,把原本只能用来点击和拖拽的鼠标,变成了一个意图定位器。用户把指针移到视频里的餐厅或者表格的数据上,顺口说一句指令,大模型就能结合当前的屏幕上下文把事情办了。 比如暂停旅游视频的画面,指着某家餐厅问「给我预定」,直接弹出地点信息和预订链接。 以前大家总觉得 AI 时代的交互要么是纯语音,要么是像全新形态的硬件那样推倒重来。但语音最大的痛点是缺乏空间定位能力,用嘴很难告诉 AI 去点屏幕上的哪一个特定像素。而鼠标恰恰是人类最完美的空间定位工具,当大模型的屏幕理解能力加上鼠标的精准定位,再配上语音的语义表达,一条效率极高的多模态交互闭环就转起来了。
发表评论 为下方 1 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓