作家 | AI 服务坊
着手 |AI 深度接洽员 管千里着厚重慧
商酌合作 | 13699120588
著作仅代表作家本东谈主
2025 年,被稠密硅谷科技首级称为 'AI Agent 元年
2025 年,跟着 Claude 、ChatGPT、Gemini Pro 等大模子才略的跃升,AI Agent 成为科技领域最炙手可热的话题。这些 Agent 不再只是被迫恢复,而是展现出惊东谈主的主动性:它们能清醒复杂指示、分撤职务想法、连续跟踪进程,甚而在完成任务时像东谈主类助手一样主动提供建议。
采访中,李飞飞示意 :" 我我方也会用一些大型语言模子去清醒某个看法、读一篇论文,或者建议一些我不太懂的问题。" 手脚斯坦福 " 以东谈主为本的东谈主工智能接洽院 " 的创办者,她对 AI Agent 的清醒愈加求实," 最让我欢快的是看到别东谈主,尤其是孩子们,也在用它来学习和提高我方。"" 我认为,靠天然语言来共享学问,或者让东谈主们通过天然语言去搜索、构想、学习,是一个十分坚定的方式。" 但她同期教唆:不管 AI 何等坚定,王人要确保东谈主们保留我方的 " 自主性 "(agency)。在她看来,AI Agent 的根底定位应该是器具而非主导者,是赋能者而非替代者。这种不雅点在当下显得尤为迫切:咱们既要拥抱 AI 带来的篡改,又要保持清醒的知道。
那么,在 2025 年这个被称为 "AI Agent 元年 " 的时刻,咱们究竟需要什么样的 AI Agent?又该如何把捏机遇?在此次深度对话中,这位策画机视觉领域的前驱者给出了她的谜底。
主理东谈主: F.F.,很欢欣见到你,接待来到 Possible。
李飞飞:通常,也很欢欣在这里见到你。
主理东谈主: 我想问一下,你当初是如何意想 ImageNet 这个主意的?阿谁让你以为"啊,咱们需要作念这个"的机会是什么?
李飞飞: 要说澄澈具体的阿谁"要津时刻"其实不太容易,但大致是在 2006 年前后。那时我十分插足地在作念接洽,使用机器学习算法来尝试清醒物体和图像。无论我如何作念、如何看,王人无法走避一个数学看法:那便是机器学习中的"过拟合"(overfitting)。所谓过拟合,便是模子的复杂度和模子所用数据之间不匹配。尤其当数据——不单是是数据量,还特等据的复杂度——并不成有用驱动模子的时间,这个问题就会十分隆起。
天然,并不是统统模子王人生而对等。咱们当今知谈所谓" NE 集中模子"(注:此处原文中出现" NE Network models ",可能指的是神经集中模子)具有更高的容量和表征才略。但撇开这些术语不谈,数据和模子之间一定是存在互相作用的。关联词我那时发现,人人只关注模子,却不关注数据,或者说只关注模子却以装假的方式看待数据。这恰是那时我产生灵感的原因——我以为咱们不仅要关注模子,或者说不成只用一种方式关注模子,而是要关注数据,让数据来驱动模子。那时我刚好到了早期管事生计的下一阶段,去普林斯顿大学任教。我在那里战斗到了一个叫作念" WordNet " 的边幅。WordNet 与策画机视觉自己莫得径直关联,但它是一种很好的方式来组织宇宙上的各式看法,而且我也很心爱" WordNet "这个名字。然后,一件事情激动着另一件事的发展,ImageNet 就这样出生了。它其实源自我对"大限制数据以及对视觉宇宙千般化表征"的浓烈信念。
主理东谈主: 你在 AI 管事生计的中段,创建了这个了不得的 ImageNet。当今你们还有一个 World Labs(宇宙实验室),我想把这条线从 ImageNet 一直延迟到 World Labs。能不成和咱们谈谈 World Labs 的想法是什么?你正在构建什么,这对咱们清醒 AI 的改日以及对 World Labs 自己,王人具有如何的要津真谛呢?
李飞飞:照实如斯。我统统这个词东谈主的接洽生计——尤其是在 ImageNet 之后——一直在十分专注地想考一个问题:什么是"智能"?咱们如安在机器中收场智能?归根结底,对我来说,它可以认识为两个十分浮浅的方面:如果咱们不雅察东谈主类智能,一方面,咱们会"语言"。咱们使用语言来交流,来组织咱们的学问,来交流信息。然而,智能还有另一个"半边",对咱们来说通常长远,那便是咱们会"作念事"。咱们会去作念各式事情,比如作念早餐煎蛋饼,或者去郊游;又或者跟一又友们沿途玩耍,享受相互的跟随。这些行动远远超过了咱们说出的任何语言。比如咱们可以惬意地坐在对方眼前,手里拿着啤酒罐,这些王人属于"智能"的一部分。
这一部分智能,内容上是招引在咱们对三维宇宙的清醒之上——咱们约略感知这个三维宇宙,并把它搬动为一套清醒、推理以及预计的经由,从而让咱们约略谢宇宙里行动。在我看来,这种才略就叫作念"空间智能"(spatial intelligence)。它是具有实体躯体的理智生物(比如东谈主类)所固有的、最根底的本能——行止理三维空间的才略。ImageNet 之是以会出现,是因为我想要给二维图像中的像素贴上标签,而关于东谈主类而言,二维图像是三维宇宙的投影。是以,从某种程度来说,ImageNet 是咱们去清醒所处的完整可视宇宙的"起步阶段"。这个起步阶段十分要津,因为无论对东谈主、动物如故机器来说,清醒并给这些图像和物体打标签,王人是很迫切的第一步。
然而当今,天啊,还是昔时 15 年甚而 14 年了吧?我以为咱们还是准备好去作念一个更无边的想法了,险些可以说是一个"全垒打"式的想法:去解锁智能的另一半——也便是"空间智能"这个问题。让空间智能如斯故真谛的极少在于,它内容上有两个层面:一个是物理的三维宇宙,另一个则是数字化的三维宇宙。而咱们昔时一直王人无法"生活"在这两者之间。
主理东谈主: 然而当今来看,空间智能可以成为一种长入的时候,既能清醒与感知"以三维为基础的物理宇宙",也能清醒"数字化的三维宇宙"。我在想考空间智能的远景时,如果回到 1880 年,那时间有马车、土壤路——你会以为那确切个霄壤之别的宇宙。可如果只回到 1980 年,东谈主们天然开的车不一样,但住房如故通常的屋子,东谈主们依旧在开车,总体来说物理宇宙的"运作机制"并莫得发生天崩地裂的变化。你以为咱们所说的这"另一半的智能"会不会在改日几十年的确带来像昔时几年数字宇宙所履历的那种"大变革",并进而篡改施行宇宙?
李飞飞: 我以为会。而且我认为施行与数字之间的界限将运波折得空泛。举个例子,我会设想我方在高速公路上开车,如果车胎爆了,我天然是个时候从业者,但我如故会以为这会是个辣手的问题。可若是我能戴上一副眼镜,或者只是用手机对着我的车、对着阿谁爆胎,通过某个应用来协助我更换轮胎,无论是通过视觉指引、如故对话景色,或者二者衔尾——我以为这便是一个最日常不外的生活场景,却可以轻佻物理三维宇宙和数字三维宇宙的畛域。我脑中裸暴露这样的科技图景:它能匡助东谈主们作念任何事,从最浮浅的换轮胎,到最复杂的腹黑手术。这种设想真的让我欢快不已。
大模子和"宇宙"模子
主理东谈主: 你还说过,你平素用 LLM(大型语言模子)来学习各式东西。我以为这是个很饱读励东谈主的例子——我家孩子老是以为我方数学可以,就不想再学了,我就可以跟他们说:"看,F.F. 李飞飞王人在用大型语言模子来学习,你们是不是还可以再奋力极少?"不外,说到大型"宇宙"模子(Large World Models)和大型语言模子(LLMs),当你向别东谈主解释它们的分手时,你会如何讲?你以为它们改日会如何发展?
李飞飞: 从根底上说,就像我之前提到的,一种是"语言的智能",另一种是"看"和"作念"的智能。它们在模态上有十分根底的分手。大型语言模子所处理的基本单元是词汇——不管是字母也好,单词也好。而在咱们所说的"宇宙模子"(World Models)中,基本单元则是像素(pixels)或者体素(voxels)。两者险些可以说是不同的"语言":语言模子对应的是"东谈主类语言",而三维宇宙对应的是"大天然的语言"。咱们的想法是让 AI 算法能让东谈主去和"像素宇宙"进行交互,不管这个像素宇宙是杜撰的如故物理的。
主理东谈主: 你刚才的回答让我想起你援用过的一句名言:社会生物学家爱德华 · 威尔森(Edward O. Wilson)曾说,"咱们领有旧石器期间的情感、中叶纪的轨制以及神一样的科技,这实在是危机非常。" 那在这样一个领有天然语言想维、又需要教化各人的情况下,你以为要如何"回转"这个说法?或者说,在 AI 期间,东谈主类有哪些机遇?
李飞飞: 我依然服气威尔森的那句话,也正因为如斯,你、我以及一又友们才沿途创办了"以东谈主为本的东谈主工智能接洽院(HAI)"。如果要说"回转"那句话,我可能会这样讲:"东谈主类约略创造近似‘神一样’的时候,从而纠正咱们所处的‘中叶纪’式轨制,并超过、或辅导咱们那‘旧石器期间’的情感,让它们酿成创造力、出产力慈爱意。"
主理东谈主: 那你以为咱们应该如何"构建"这种时候,来匡助东谈主类收场这些好意思好的想法?重点是放在"恻隐心"上吗?如故说愈加正式东谈主自己与时候之间的共生关联?如果想让科技和 AI 匡助咱们成为更好的东谈主,你以为下一步最该作念的是什么?
李飞飞: 我知谈你主修过形而上学与时候之类的专科(笑),能看出来你对此很感风趣。我也原意你的不雅点。提到那句话,咱们每每把"旧石器期间"看作负面的东西,但其实它并不是一个贬义词,而是个中性的看法。东谈主类的情感、咱们对自体态象的知道,王人深深地植根于咱们的进化和 DNA 中,这是不会节略篡改的。咱们的宇宙也正因为如斯而既灿艳又杂沓词语。因此,当咱们在探讨时候,以实时候和东谈主类改日的关联时,就要去尊重这些最根底、的确在"旧石器期间"就扎下来的东西。有几件事是时候发展必须尊重的,尊重得越好,对咱们就越成心。
第一,要尊重东谈主类的自主性(human agency)。
我以为 AI 在公众层面上的交流问题之一,便是人人平素在语句里把" AI "当成主语,好像它替代了东谈主的自主权。比如说," AI 诊断疗癌症",我未必也不注重这样说过。可事实是,东谈主类会"使用 AI "去诊疗癌症,而不是" AI 我方"去诊疗癌症;" AI 会攻克核聚变",其实是东谈主类科学家和工程师"使用 AI 器具"去攻克。更危机的说法是" AI 会抢走你的服务"之类的。我以为咱们应该看到,这项时候其实有更多机会去创造新的岗亭、带来更多的可能性,赋能东谈主类的自主性。这是我十分垂青的一个基本原则。
第二,要尊重东谈主自己。
每个东谈主王人但愿我方健康、有建立感,并在社会中受到尊重。不管咱们如何研发和使用 AI,王人不成淡薄这极少。淡薄它是危机的,也会遮人耳目。我以为光是这两条原则,就足以在时候开发的经由中起到指引作用。我之是以会这样筹商,背后的深层信念是:任何时候、任何创新的真谛,最终王人应该是"造福东谈主类"。这亦然东谈主类闲雅的走向:咱们发明每一种器具,起先王人是想把它往好的标的用。但这就像一把双刃剑,总会有东谈主虚耗它,是以咱们也不得不愈加奋力地去让它变得更好,愈加"以东谈主为本"。这亦然咱们在斯坦福沿途创办"以东谈主为本的东谈主工智能接洽院"(HAI)的根底原因。咱们把 AI 视为一种极其坚定的器具——它是一种"闲雅性"器具,因此越早就把一个"以东谈主为本并服务于东谈主类福祉"的框架搭建起来,就越能让咱们在改日走得更稳。
关于"以东谈主为本的 AI "这一理念,我认为最要津的部分之一,便是"赋能东谈主类"。我但愿每一家企业、每一个开发者王人能恪守这个理念。
当下 AI 发展近况
主理东谈主: 你在东谈主工智能领域作念了这样多年,担任过各式脚色。我嗅觉许多东谈主当今才运转舒缓了解 AI。你对当下 AI 创新的近况如何看?包括咱们当今所处的位置、开发者所濒临的挑战等。你以为要想搞定这些问题、再上一个台阶,咱们当下该作念些什么?
李飞飞: 这是一个非同凡响的时刻。我以为这真的是一个环节"拐点",因为 AI 的应用当今可以落到普通东谈主和普通企业的内容使用当中。咱们这些早期的 AI 前驱,曾在任业生计初期所期待的许多愿景,如今还是酿成施行或行将成为施行。比如,公众每每提及"图灵测试",而如今这险些还是是一个被攻克的难题了。天然图灵测试并不是推测智能的终极法度,但它也曾被视为一谈极难的门槛,如今也可以说是被轻佻了。自动驾驶亦然一样,天然还没作念到百分之百无缺,但和 2006 年比较还是得到了巨猛进展。是以,我以为跟着这些坚定的模子被的确用于出产环境,提供给普通东谈主和企业使用,咱们当今正处在一个令东谈主豪放的 AI 立异期间。不外我也十分澄澈,咱们身处硅谷这个"泡泡"之中吧。
主理东谈主: 我以为,全球大部分东谈主其实王人还在奋力跟上 AI 的发展要领。咱们天然能看到改日,也知谈改日会走向何方。是以我服气许多 Possible 的听众也会对你所说的那些想法产生共识:AI 可能极地面栽培东谈主类才略,也可能带来巨大的积极影响,但咱们照实需要挂牵那些负面成果,并但愿能在正确的轨谈上辅导 AI。那从开发的角度看,你以为咱们需要如何作念才智确保 AI 走向积极的标的?如果你认为政府或者跨行业的合作是必要的,也请谈谈这方面的想法。
李飞飞: 率直说,咱们照实能作念许多事情,而且咱们就应该尽快去作念,早就该作念了,但当今运转也不算晚,唯有咱们赤忱诚意地去行动。
第极少,我以为咱们应该用"科学"而不是"科幻"来指导一切。昔时对 AI 的宣传和言论有许多夸张,比如" AI 会导致东谈主类死灭"或者" AI 会带下宇宙和平"——两种说法王人更像科幻而非科学。是以,谈到 AI 政策或治理时,咱们需要基于数据、基于科学事实和科学方法,这极少十分迫切。
第二点,我真的服气,就像其他许多时候和器具一样,咱们需要给 AI 的应用场景加上"拘谨措施",即在的确对东谈主类产生影响的场地去管控,而不是去阻断其上游研发。想想汽车刚出现的时间,其实并不如何安全——最运转甚而莫得安全带,莫得车门,也莫得限速等等。自后咱们照实付出了一些代价,包括东谈主员伤一火,但随后东谈主们并莫得要求福特或通用"关停工场",而是通过立法和监管,要求配备安全带、制定速率截至等。今天的 AI 也一样:它是一种极具赋能后劲的时候,但它会带来某些风险,是以咱们应该关注它在内容应用中的监管,比如当 AI 被用于医疗时,咱们如何更新 FDA(好意思国食物药品监督管制局)的相应规矩;当 AI 被用于金融时,如何成立监管护栏来保证安全。是以,应用层面的监管才是治理要点所在。
第三点(但并非不迫切)是要签订到:要让 AI 的改日变得积极,需要有一个"积极的生态系统"。这个生态系统既需要私营部门,也需要全球部门。
私营部门既包括大型公司,也包括初创企业,它们王人十分迫切。全球部门则关乎"全球产物"(public goods)的出产。我认为全球产物可以分两类:
基于有趣心的创新和新学问,比如说用 AI 作念聚变接洽、用 AI 治病、用 AI 赋能闇练等等。许多这样的想法和接洽每每来自全球部门——就像 ImageNet 当年便是源自全球部门扶持的接洽。
东谈主才(people)。咱们需要让更多年青东谈主、更多公众了解这项时候,而全球部门在从 K12(基础教化)到高级教化的领域,承担着主要的社会教化职守。是以这些便是我十分暖热的几个 AI 治理与政策方面的要点。
AI 在医疗服务的应用
主理东谈主: 你刚才说的这些,我也想补充极少" AI for all "(让统统东谈主王人能战斗并使用 AI)的话题。因为你一直王人在激动这件事,不但愿 AI 只属于那些顶尖确认、从加州理工拿到物理学博士又在斯坦福任教的精英,而是让统统东谈主王人有机会战斗它。能跟咱们谈谈 " AI for all " 这个边幅的服务和孝顺吗?
李飞飞: AI For All 是一个非谋利组织,我与以前的学生和共事共同创办的。它的服务便是给来自不同布景的 K12 学生提供机会,让他们通过大学暑期边幅或实习边幅战斗 AI。这样作念的想法便是为了收场"全球产物"中的教化部分。咱们王人知谈,AI 会篡改宇宙,但"谁来篡改 AI "?咱们但愿让更多多元化的东谈主群加入到 AI 的开发和使用当中,把这项时候应用到各式好意思好的用途上。
主理东谈主: 你在医疗领域也作念了许多服务,人人应该也属意到 AI 在改善东谈主类健康和生活方面大有后劲。能谈谈你在医疗领域的接洽,以及你对 AI 在医疗保健(health care)改日发展的祈望吗?
李飞飞: 是的,我在我的书里也写到过,我对 AI 在医疗领域的应用充满热诚。原因有许多,其中最中枢的是:医疗自己便是"以东谈主为本"(human-centered)的中枢领域。统统这个词医疗行业十分广袤,涵盖从药物研发或体外诊断(bioscience & diagnostics)到临床诊断与休养、到医疗服务(healthcare delivery)和全球卫生。这一远大的体系中,AI 在每一个法子王人有可能发挥巨大作用。
我本东谈主十分关注的一个领域是"医疗服务",也便是东谈主与东谈主之间的内容照护场景。比如说,在好意思国,咱们的照顾数目远远无法餍足病患需求,而且照顾的服务负荷十分大,流失率也很高。还有一些惊东谈主的统计数据,比如有的照顾在一个班次里平均要走四英里的路,只是用来取药或拿设备;或者一个班次里要处理 150 到 180 项任务。同期呢,病院里也出现了许多安全问题,比如患者因为穷乏有余照顾而从病床上跌落;关于严重的败血症(sepsis)病患如何进行分诊亦然个难题。再加上东谈主口老龄化问题,比如有些老东谈主在家中茕居,存在颠仆风险或老年死板的恶化……是以,在昔时十多年里,我一直悉力于接洽如何使用"智能录像头"(smart cameras)——一种非侵入式、非战斗式的录像头——来匡助防守东谈主员更好地关注病东谈主的景况。举例,监测病东谈主是否会从病床上摔下来;如果是在家,可以监测他们的行动、心情或养分摄入;在手术室里,可以监测手术器械的使用情况,让照顾无用不竭地盘货器械,幸免把物品留传在病东谈主体内。咱们称这类时候为"镶嵌式智能"(ambient intelligence),想法是匡助大夫和医护东谈主员愈加全面地照顾患者,进而栽培全体防守质地。
AI Agent 的远景
主理东谈主: 当今人人也平素提到" AGI "(通用东谈主工智能),但我谨记你也曾说过:其实你王人不笃定" AGI "到底指的是什么,因为不同东谈主给它的界说王人不一样,像是各自的"罗夏检会"(Rorschach Test)。能不成谈谈你对" AGI "这场筹商的看法?或者说,咱们该如何更感性地看待它,而不是要么以为"它太棒了"要么以为"它太可怕",仿佛要澌灭统统服务或赈济统统这个词东谈主类?
李飞飞: 这照实既真谛真谛又令我颓丧。我真心不知谈" AGI "到底意味着什么,因为我以为这个词起先是来自买卖领域,差未几十年前 AI 渐渐熟识后,买卖界就运转更频繁地筹商它。其实,它起先的宅心可能是为了强调改日的 AI 需要"通用化才略",而不是极度窄小的任务。比如说,当今的自动驾驶汽车还是比昔时那些只可识别"树木"的单一视觉模子要"通用"得多。窄小的 AI 只可完成一个十分特定的任务,而更"通用"的 AI 能搪塞多种任务,这的确是个实实在在的分手。
我一直以为困惑的极少是,如果总结 AI 的发源,约翰 · 麦卡锡(John McCarthy)和马文 · 明斯基(Marvin Minsky)这些早期奠基者在 1956 年那场着名的夏日研讨会上,所怀抱的逸想一直王人是"让机器能想考,能匡助东谈主类有运筹帷幄,甚而能作念到一些东谈主类作念不到的事"。他们从来莫得说"咱们只想作念一个只可识别树木的窄领域 AI "。从一运转,"东谈主工智能"这个领域出生时就伴跟着"想考机器"的渴望。是以从这个角度看,我不知谈我方该叫它" AI "如故" AGI ",对我来说,这其实便是一趟事。
主理东谈主: 我也在想,就像你说的那种 AI 约略"作念事情"——最近跟着语音和对话式 AI 的跳跃,嗅觉就离那种"我能和 AI 像普通东谈主一样对话,然后它去实施各式任务"的场景越来越近了。你当今生活中有莫得在用肖似的" AI Agent "器具?或者你以为在改日几年里,这种有"行能源"的 AI Agent 和语音交互会如何篡改咱们的生活?
李飞飞: 我照实以为,靠天然语言来共享学问,或者让东谈主们通过天然语言去搜索、构想、学习,是一个十分坚定的方式。我我方也会用一些大型语言模子去清醒某个看法、读一篇论文,或者建议一些我不太懂的问题。最让我欢快的是看到别东谈主,尤其是孩子们,也在用它来学习和提高我方。不外我如故想强调极少:不管如何样,王人要确保东谈主们保留我方的"自主性"(agency),何况给他们好的器具去学习、去赋能我方。跟着这类坚定器具的不竭进化——我本东谈主也在参与其中——咱们会看到越来越多的配合才略,让东谈主们能更个性化地使用这些器具,我对此很期待。
主理东谈主: 我也以为,强调这极少十分迫切:咱们并不是为了替代东谈主类或消散东谈主类交互。因为未必间东谈主们会说,"那些作念 AI 的东谈主想把东谈主替换掉,把咱们王人绑在屏幕前盯上 10 个小时。" 其实莫得东谈主想一天到晚对着屏幕,咱们王人知谈东谈主类来去有多迫切,它对教训、对社区、对共情王人真谛环节。你在那本灿艳的自传《宇宙我来过》(The World's I See)里提到过你高中的数学敦厚 Sabella 先生,他就体现了"东谈主与东谈主互动"的迫切性。能不成说说那段履历,以及他给你留住的珍爱建议?
李飞飞: 我在书里记载了我早年的履历。那时我是一个 15 岁的外侨女孩,刚到新泽西的公立高中就读,英语也不会讲,可以说是我的东谈主生起始之一。十分红运的是,我很快就碰到了数学敦厚 Sabella,他对我十分尊重,老是无条款地扶持我。自后他不仅是我的数学敦厚,也成了我在那段贫瘠芳华岁月里最佳的一又友,一直到他厌世王人一直保持有关。他教给我的,并不是坐下来对我说," F.F.,让我告诉你,AI 会应用宇宙,你要谨记以东谈主为本哦。"——那时根底就莫得 AI 这个说法,也没东谈主会聊这些。他更像是通过日常的行动让我体会到:对社会、对生活而言,最迫切的是咱们如何相互作念出积极的事情,怀抱如何的信念,以及咱们追求的"光"在那儿。通过他的行动,我学会了"尊重并匡助其他东谈主"是件何等好意思好的事情。哪怕这个东谈主只是一位懵懵懂懂、不会说英语的外侨小孩。对我来说,他所教给我的最大启示便是要"把东谈主放在中心"。
主理东谈主: 真好意思好,谢谢你共享。
原文流畅:https://www.youtube.com/watch?v=0jMgskLxw3s&t=1251s&ab_channel=ReidHoffman
中原基石 AI 战术带领力特训营 2025 年第四期运转报名!
收拢数字智能期间的机遇,团报即可享受优惠!
机会难得,限额有限,别错过!
报名及商酌:柳敦厚 15202171854