告别手搓Prompt,前美团高管创业,要让物理世界直接成为AI提示词



机器之心发布

正如奥特曼执意打造硬件,试图打破手机屏束缚,要让 AI 感受物理世界;Looki 的诞生也源于同样的渴望:补齐大模型「感官智能」的最后拼图,将现实场景实时转化为上下文,驱动人机交互从「被动问答」进化为「主动共鸣」。

2025 年,AI 硬件赛道喧嚣一片。从形态各异的 AI 眼镜,到 OpenAI 传闻中的无屏设备,无数玩家正试图摆脱智能手机的束缚。其底层逻辑清晰可见,今天的 AI 不缺智商,缺乏的是「在场感」

被困在对话框里的大模型如同「缸中之脑」。当你需要复盘会议或分析孩子情绪时,却不得不将鲜活场景压缩成干巴巴的文字描述,这种依赖「手动 Prompt」的交互不仅低效,更是反人性的。我们被迫充当了 AI 的「人肉传感器」,而大模型因缺乏 Context(上下文语境),始终处于对物理数据的极度饥渴中。

「在物理世界中,人类本质上是被动的生物。我们期望让 AI 变得主动。」Looki 创始人兼 CEO 孙洋一语道破。

正是带着这样的思考,一支自带自动驾驶基因的团队,试图将那套解析道路环境的「从感知到决策」逻辑复用到日常生活中,填补大模型对于物理世界的认知「盲区」。他们打造的 Looki L1,在北美市场积累首批口碑后,于今天正式面向国内发布。

这款 AI 原生多模态可穿戴设备,旨在将实时视听信号转化为模型上下文,让物理世界本身,成为驱动 AI 思考与服务你的最高效 Prompt。

一、藏在 30g 机身里的「智能感知」系统

从「车看路」到「AI 看世界」,这是自动驾驶感知算法的一次微缩实战。

如果说云端大模型是「大脑」,那么 Looki L1 就是由于算力限制而不得不外挂的「视神经」。第一眼看到 Looki L1 的人,很难不将它误解为一款挂坠形态的相机。它形态十分迷你,仅重 30g,支持磁吸或直接佩戴。



这种误解源于我们对「镜头」的固有认知,镜头生来是为了审美服务的。但对于 Looki 来说,镜头是服务于机器认知的,它本质上是一个庞大的、始终在线的多模态感知器。它不需要拍得「美」,但必须拍得「懂」。它支持 1080P/30 帧画面,待机 12 小时拍摄,就像一块海绵,全天候吸收你的光影世界。

孙洋认为,任何硬件形态都有其优劣势,AI 眼镜当下在续航、重量和功能上存在「不可能三角」。而 Looki 选择挂坠形态,则是在当前供应链能力下,为了实现「全天候静默采集」这一核心需求的最佳妥协方案

这种妥协背后,是团队技术基因的「降维打击」。

「以前是教车怎么看路,现在是教 AI 怎么看懂你的生活」,孙洋谈道。这种跨界视野,源于两位创始人独特的履历拼图。孙洋和刘博聪均毕业于卡内基梅隆大学,而在分别执掌美团智能硬件与自动驾驶算法业务之前,他们还曾在 Momenta 与 Pony.ai 两家自动驾驶企业深耕一线。

他们将自动驾驶「从环境感知到自主决策」的闭环逻辑,从道路平移到了生活场景,其感知机制体现在两个层面:

这套机制构成了团队从「车」迁移到「人」的底层基座,更为接下来的云端处理提供了丰富的原始数据。

二、超越 RAG,搭建一套专属用户的「数据飞轮」

从「多维数据」到「结构化记忆」,真正的壁垒在于构建一套用户专属的 Context Engineering(上下文工程)。

Looki 团队沿用自动驾驶的「数据飞轮」逻辑,来重塑用户的个人记忆:从硬件端收集数据,到建立多层级数据索引和多任务拆解,最终打造一套高效工作的 Agentic System(代理系统),让 AI 能像人脑一样,有索引、有重点地调用你的生活数据。



据 CTO 刘博聪介绍,这套系统的独创性,在于挑战了当前多模态模型的两大痛点:

首先是「长时序数据理解」。针对大模型处理大量多模态数据流(如数十万级别)容易产生「幻觉」的通病,团队通过工程优化,让 AI 能准确理解,并串联起跨度极长的时间切片。

其次是应对「多模态数据的 Context 爆炸」。视频与图像的查询会消耗巨大的上下文窗口。Looki 在云端构建了一套高效的上下文管理机制,能够根据查询需求,在海量数据中精准提取关键特征,而非粗暴地将所有素材灌入模型。

当然,这一切的基石是数据的隐私安全。Looki 通过端侧隐私过滤与 App 手动上传机制,确保数据流转的安全性。最终,物理世界的切片,被转化为结构化的「云端记忆库」。

如果说 GPT 是你工作的上下文,装载了人类的通用知识;那么 Looki 正在构建的,就是你生活的私有上下文,装载了你独一无二的经历与轨迹。

三、从「手动 Prompt」到「主动式 AI」

当语境足够丰富,交互终将进化为主动式「预判」。

目前硅谷普遍认为,我们终将迎来从 Chatbot 走向 Agentic AI(代理式 AI) 的范式转移。行业预测显示,自主 AI 代理市场将在未来三年迎来爆发性增长,而 Memory(记忆)与 Context(上下文) 正是这场进化的核心护城河。

Looki 的野心,正是基于这两者,通过可穿戴硬件构建通往「主动智能」的入口。

目前,Looki 交付给用户最显性的功能是「AI 自动剪辑」。它精准切中了那些热爱记录、却被后期剪辑劝退的用户痛点。用户在佩戴拍摄的同时,Looki 的算法自动识别一天中的高光时刻,自动生成有叙事逻辑的 Vlog。







基于这层理解,真正的质变在于「隐性洞察」。

随着记忆库的沉淀,Looki 将不再是被动等待指令的记录仪,而是能够进行推理的 Agent。它不仅记录你的饮食,更能在你点夜宵前,基于全天摄入主动发出「热量预警」;或在你情绪激动时,基于对话语境提供理性的沟通建议。



这种基于实时物理反馈的交互,让 AI 从「被动问答」进化为「主动共鸣」,这才是 AI 硬件区别于手机 App,能够真正接管用户生活的核心价值。

四、结语:当物理世界成为提示词

在 Looki 团队的构想中,硬件形态从来不是终点,而是一个「长在物理世界里的数据接口」。这也道出了 Looki 的实质:无论它今天是挂坠,还是未来演化为眼镜或耳机,其核心使命从未改变,那就是解决物理世界的数据饥渴,帮用户积累最宝贵的私有数据资产。

在 AI 时代,算力会被摩尔定律稀释,模型会被更强的版本迭代,但你在这个世界上生活过的痕迹、你眼中的风景、你与家人的对话,这些 Personal Context 构成了独一无二的你。而 Looki,就是帮你将这份资产,转化为 AI 能够理解共情的「数字直觉」。

当 AI 拥有了「在场感」,它就不再是云端那个冰冷的工具,而是你生活中的「第二大脑」。

最强大的 Prompt,其实是你未曾说出口的生活本身。


nginx