2026年6月个人开发者霸榜抱抱脸Top2,推荐必看

  • 时间:
  • 浏览:98
  • 来源:南宁市武鸣区陆酷巴网络科技工作室

个人开发者凭什么挤进Top榜单

2026年6月, 抱抱脸模型排行榜上出现了反常状况, 在智谱GLM - 5.2、百度、NVIDIA等众多大厂机构的模型当中, 一个个人开发者账号“逯雨鑫”的模型显著地跻身前排, 其下载量居高不下, 甚至有一段时间还胜过GLM - 5.2占据榜首。智谱AI负责人在X(原Twitter)上公开推荐了这个模型, 进而引发社区热烈讨论。

这位处于当下在美国某所高校钻研AI方向硕士学位的开发者, 依靠其自身的力量, 于仅仅一周的时间以内, 使得自身的模型在抱抱脸占据榜首位置, 下载数量总计超过70万次。他向量子位表明,这并非借助运气, 而是依据一套严密的技术方法论以及大量的数据处理工作。

Fable 5与Gemma 4的巧妙融合

逯雨鑫这次发布了两个新模型。其核心思路是把Fable 5的编程推理能力“蒸馏”进一个能够在本地运行的Gemma 4 - 12B小模型里。教师数据主要源自Cursor的Composer 2.5, 还辅以Fable 5。Composer 2.5做错的题目, 会交给Fable 5再次进行推理, 从而生成新的思维链跟正确代码。

模型卡呈现出这样的情况, 训练数据有着被称作“可验证”的代码推理形式, 具体表现为, 跟每条思维链相对应的代码, 都一定要在真实的环境里实现跑过测试这一行为, 并且在真正经过测试、得以通过之后方能够保留下来。就是因为存在这种对数据质量进行严格把控的情况, 才确保了哪怕是小模型依然能够输出可靠的推理结果。

V2版本来临:本地Agent的突破

V2版本将agentic能力予以引入, 增添了多步工具调用功能。用户能够把它当作本地Agent来使用, 自行达成“阅读-推理-动手-验证”的闭环操作。在tau2-bench的telecom子集中, 基座Gemma-4-12B的得分仅仅是15%, 但V2版模型的得分却高达55%, 性能提高了约3.5倍。

只不过作者也承认, 这是在本地自行测试、于单一领域之内、针对20个任务运行而得出的相对数值, 是不能够直接同官方榜单开展比较的东西, 并且和前沿的大模型之间仍然存在着不小的差距情况。然而这样的一个结果已然致使不少的开发者察觉到了在本地运行具有强大能力的Agent的可能性所在。

数据处理:最耗时的核心工程

逯雨鑫讲道, 整个进程最为耗费时间的并不是训练, 而是数据处理, 特别是agentic数据, 真实的对话常常甚长, 一个任务也许会有十几步, 关联到几千乃至上万个token, 他运用类似“滑动窗口”的办法, 把最近一次用户的消息当作锚点, 将上下文裁剪至预算范围之内。

他又提及, Fable 5随后被下线了, 仅他自身的数据集留存了Fable 5最初的推理过程。社区贡献数据里缺失的部分推理, 被他用Claude Opus 4.8(xhigh)重新去生成, 一条条给补上了。尽管重建的轨迹或许和原版存在差异, 但这是那时唯一可行的办法。

本地运行:推动实际应用的关键

llama.cpp生态里常见的本地模型格式是GGUF格式, llama.cpp、Ollama、LM Studio、Jan等工具能直接加载此格式, 这一具备能够直接加载的特性, 对于那些和涉及私有项目以及处在本地环境当中的关于编程、代码审查、命令执行与调试那样的各种场景而言, 极具极大的吸引力。

有个叫逯雨鑫也算过这样的情况, 要是把模型量化到大概3bit左右的程度, 那么好多配置8GB统一内存的Mac用户是能够运行该模型的, 并且还能够留出一定的上下文窗口。他又觉得好多人也就是仅仅想要利用AI来整理文件, 还有进行处理各种数据, 以及去制作PPT, 或者是体验一下agent, 并非必定愿意每个月为Claude、GPT来支付费用。

未来方向与个人开发者的机遇

被称作逯雨鑫的这个人表明, 他自己未曾料想到此次之后训练所获得的提升幅度会如此之大, 后续将会持续予以推进。那V2这一版本在tau2-bench telecom方面呈现出一种“过度进行尝试、反复实施retry”的状况, 而V3则打算凭借更多的训练去加以改进。他总计在HF上公布了9个公开的模型,除开两个成为爆款的之外, 还曾做过“直接去蒸Claude”的模型。

就个人开发者来讲, 那人的经历表明: 那大厂虽有着更多研究者以及更强的算力, 可个人开发者没有那些包袱, 反倒能够更专心地去解决一个特定痛点。逯雨鑫觉得, 这恰是开源作者的机会所在之处: 不用去做全能模型, 而是把一个足够特定的问题做得好用。要是你也想体验这款本地模型, 能够访问 www.fc-bowuguan.cn 获取更多信息。

你是否愿意放弃每月订阅费,改用本地模型处理编程和Agent任务?欢迎在评论区分享你的看法。

猜你喜欢

2026年6月探秘大语言模型能力来源及形成机制

Interpretability)研究,开始尝试揭示模型内部的计算机制。Heads)被广泛认为是大模型涌现上下文学习能力的关键神经机制。从内部机制到模型能力的因果验证:能力与归纳头变化完全同步。未来,当这个问题能被系统地回答,大模型的「黑盒」,也许就不再那么黑了。

2026-06-29

2026年6月,AI自己造AI倒计时已开启?概率60%

AI自己造AI的倒计时,真的开始了。2026年第二季度,一个典型工程师每天合并的代码量,是2024年的8倍。80%的代码、8倍的产能、52倍的加速、19天不眠不休的独立编程、60%的概率、不到六个月的倒计时——

2026-06-29

2026年6月,人形机器人协调全身移动操作能力怎么样?

一套真正适用于广泛移动操作任务的人形机器人系统,应该满足哪些基本条件?迁移到人形机器人的全身动作空间。从「会走路的双臂平台」,到真正能协调全身的人形机器人,中间还有大量系统问题要回答。

2026-06-29

2026年6月推荐:机器人世界模型Top3评价,优缺点直击人心

但我们一直有一个挥之不去的疑问:机器人真的应该在像素里学习物理吗?很厉害,很贵,也很可能不是机器人最需要的东西。“请给我更多机器人数据”?作者们认为机器人需要自己的符号空间。“万能”,但可能更接近机器人真正需要理解的世界。作为机器人世界模型的符号空间。

2026-06-29

2026年6月必看Top1:AI时空漫游Vlog推荐

如果你还没看过Chloe的「AI时空漫游」系列,那你可能正在错过2026年最令人上瘾的视觉体验。2400万人,看她「死」在泰坦尼克号上标题是:《我穿越到了1912年的泰坦尼克号》。从今年3月开始,Chloe密集输出了超过多个时空漫游Vlog。公元前30000年,冰河时期。

2026-06-29