如果您从事金融行业,那么围绕即将进行 IPO 的 Cerebras 的新闻都是关于该公司的股票代码在纳斯达克的表现。
但是,如果您喜欢技术,情况就有点不同了。事实上,如果你只关注这些公司将如何竞争,你就真的错过了大局。
很多人都知道 AI 革命的开始如何导致用 GPU 取代 CPU 的想法:GPU 是一种更复杂、更专业的逻辑处理器,适用于机器学习和相关工作。
当时,我们遵循一种非常常见的规定方法 – 输入大量训练数据,其中通常包括大量的 Web 抓取 – 然后用它来测试系统。
所有这些工作都需要大量的处理能力,而 GPU 就是为这些大型工作负载而构建的。
现在,该行业似乎正在向前迈进,朝着一种称为推理的东西发展,这是一种不同类型的任务,硬件将不得不更加专业化。
那么什么是推理呢?因为每次有人开始谈论它时,你都能看到人们的眼睛有点呆滞。一般来说,我们不喜欢在高度科学背景之外使用这种词。
嗯,无论如何,推理基本上是 AI 动态学习的能力——获取实时数据并将其放入经过训练的模型中,以获得合乎逻辑的结果。
换句话说,训练有素的 AI 正在展示它从训练课程中学到的东西。
因此,这种类型的活动将需要一些具有一定重量的硬件:为此,Cerebras 推出了晶圆级引擎 (WSE),对于技术爱好者来说,它具有一些令人印象深刻的规格。(这些怪物芯片是由台湾积体电路制造公司实际生产的,这可能并不奇怪)。
WSE:揭秘
Cerebras 的 WSE-3 拥有 4 万亿个晶体管和数量惊人的片上存储器。它有大约 9000 个内核,估计容量为 125 petaflops。
我们前段时间报道了这些类型的巨大多核引擎,其中的硬件物理尺寸很大 – 以英寸而不是厘米为单位。
“更低的延迟会带来更高的用户参与度,”Perplexity 首席技术官 Denis Yarats 在一份新闻声明中指出。“Cerebras 的速度比传统 GPU 快 20 倍,我们相信用户与搜索和智能答案引擎的交互将从根本上发生转变。”
不难看出,这种力量将如何为许多行业的 AI 工作提供动力。
AI 推理的使用案例
考虑这一消息的一种方式是,我们只是希望为一组更复杂的流程提供更高的速度和功能。但你也可以考虑推理在我们 AI 发展的这一部分将发挥的作用。换句话说,我们正在从监督性更强的学习类型转向监督较少的学习类型——从我们 10 年前做的那种确定性机器学习,到一种新型的神经网络活动,我们相信系统能够更多地自行学习。
因此,Cerebras 的新挑战的故事,更不用说另一家赶上潮流的公司 Groq,就是硬件迎头赶上的故事。
硬件本身令人印象深刻——这些新的凯迪拉克系统引起了人们的注意——但我们应该关注的是这些物品的制造目的,这将扰乱业务。
“随着 AI 融入日常生活和业务运营的更多方面,高效和准确的 AI 推理的重要性越来越大,”Run:AI 的一位作者写道。“准确推理在医疗保健、欺诈检测和自动驾驶等敏感使用案例中尤为重要。”
这些只是一些顶级示例:我们还没有真正发现更深层次推理模型的一些更隐蔽的用途。十年后的 AI 会是什么样子?它仍然看起来像是从计算机中出来的吗?还是情况真的会有所不同?
几年前,福布斯技术委员会成员 Nir Kaldero 给了我们这份名单:其中一些承认具有很强的持久力,尽管考虑其中的一些很有趣。例如,云:当然,云的采用仍在继续,但现在我们对许多工作负载有一个相互竞争的想法。它在边缘、设备上、网络边缘进行处理。而且这也正在取得进展。
无论如何,硬件之战确实预示着下一代技术系统的到来。他们将会非常壮观。