ag百家乐接口多少钱 26 年前的古董 Win98 电脑得胜开动大谈话模子:搭载奔腾 II 解决器、128MB 内存

发布日期:2024-12-25 03:21    点击次数:51

IT之家 12 月 30 日音信,一个名为 EXO Labs 的组织当天在搪塞媒体上发布了一段视频,展示了一台开动 Windows 98 系统的 26 年乐龄的奔腾 II 电脑(128MB 内存)得胜开动大型谈话模子(LLM)的情形。随后,EXO Labs 在其博客上发表了一篇防御著作ag百家乐接口多少钱,进一步推崇了这个技俩的细节,以过火“栽植东谈主工智能”的愿景。

IT之家珍爱到,视频中一台 350MHz 的 Elonex 奔腾 II 电脑启动 Windows 98 后,EXO Labs 开动了基于 Andrej Karpathy 的 Llama2.c 征战的定制纯 C 推理引擎,并让 LLM 生成了一个对于“Sleepy Joe”的故事。令东谈主诧异的是,通盘这个词经由开动运动,故事生成速率也超越可不雅。

EXO Labs 由牛津大学的探求东谈主员和工程师构成,于本年 9 月肃穆对外亮相,其职责是“栽植东谈主工智能”。该组织以为,少数大型企业戒指东谈主工智能会对文化、真相以及社会其他基本方面形成负面影响。因此,EXO Labs 但愿“构建敞开的基础才气,以覆按前沿模子,并使任何东谈主齐能在职何处所开动它们”,从而让平庸东谈主也能在着实任何成就上覆按和开动 AI 模子。这次在 Windows 98 上开动 LLM 的豪举,恰是对这一理念的有劲施展。

字据 EXO Labs 的博客著作,他们从 eBay 上购得了一台旧式 Windows 98 电脑。然则,将数据传输到这台老机器上却是一个挑战,他们最终通过其以太网端口使用“陈腐的 FTP”完成了文献传输。

更大的挑战在于为 Windows 98 编译当代代码,运道的是他们找到了 Andrej Karpathy 的 llama2.c,这是一个“用 700 行纯 C 代码即可在 Llama 2 架构的模子上开动推理”的器用。借助这一资源以及旧式的 Borland C++ 5.02 IDE 和编译器(以及一些小的退换),EXO Labs 得胜将代码编译成可在 Windows 98 上开动的可实施文献。他们还在 GitHub 上公开了最终代码。

EXO Labs 的 Alex Cheema 脱落感谢了 Andrej Karpathy 的代码,ag平台百家乐并对其性能陈赞不已,称其在使用基于 Llama 架构的 26 万参数 LLM 时,在 Windows 98 上齐全了“每秒 35.9 个 token”的生成速率。值得一提的是,Karpathy 曾任特斯拉东谈主工智能独揽,亦然 OpenAI 的创举团队成员之一。

天然 26 万参数的 LLM 限度较小,但在这台陈腐的 350MHz 单核电脑上开动速率超越可以。字据 EXO Labs 的博客,使用 1500 万参数的 LLM 时,生成速率略高于每秒 1 个 token。而使用 Llama 3.2 10 亿参数模子时,速率则相称逐步,仅为每秒 0.0093 个 token。

EXO Labs 的策划远不啻于在 Windows 98 机器上开动 LLM。他们在博客著作中进一步推崇了其对往时的掂量,并但愿通过 BitNet 齐全东谈主工智能的栽植。

据先容,“BitNet 是一种使用三元权重的 transformer 架构”,使用这种架构,一个 70 亿参数的模子只需要 1.38GB 的存储空间。这对于一台 26 年前的奔腾 II 来说可能仍然有些勤恳,但对于当代硬件甚而十年前的成就来说,齐相称轻量级的。

EXO Labs 还强调,BitNet 是“CPU 优先”的ag百家乐接口多少钱,幸免了对崇高 GPU 的依赖。此外,据称这种类型的模子比全精度模子效果高 50%,况且可以在单个 CPU 上以东谈主类阅读速率(约每秒 5 到 7 个 token)开动一个 1000 亿参数的模子。

告白声明:文内含有的对外跳转聚拢(包括不限于超聚拢、二维码、口令等神志),用于传递更多信息,从简甄选时刻,扫尾仅供参考,IT之家通盘著作均包含本声明。

]article_adlist-->   声明:新浪网独家稿件,未经授权拒接转载。 -->