首页 » 99链接平台 » 速度10倍于B200,哈佛辍学生打造(芯片辍学史上公司算法)

速度10倍于B200,哈佛辍学生打造(芯片辍学史上公司算法)

南宫静远 2024-11-21 07:58:16 0

扫一扫用手机浏览

文章目录 [+]

在这个人工智能飞速发展的时代,算力一直是制约机器学习和大模型应用的瓶颈。
虽然GPU厂商如英伟达、AMD等不断推出新一代芯片产品,但其通用性设计的局限性,很难完全满足当前AI和大模型计算的需求。
直到一家名不见经传的初创公司Etched悄然崛起,打造出了一款被称为"史上最快AI芯片"的Sohu,才彻底颠覆了这一行业格局。

作为一家成立仅两年的初创公司,Etched凭借一支年轻的团队,以及对人工智能发展趋势的精准洞察,在最新一代AI芯片领域取得了令人瞩目的突破。
Sohu芯片不仅在运算速度上完爆行业巨头英伟达的H100和3月刚推出的B200,在能源利用效率、硬件架构优化等多个维度,也展现出了优异的性能表现。
这无疑为人工智能领域的技术创新注入了强大动力,也令业内人士为之侧目。

究竟是什么让Sohu芯片脱颖而出,成为"AI时代革命性力作"?又是哪些关键因素推动了它的诞生?下面让我们一起深入探讨这一备受瞩目的黑马产品。

速度10倍于B200,哈佛辍学生打造(芯片辍学史上公司算法) 99链接平台
(图片来自网络侵删)

优化硬件架构,实现Transformer算法专属加速

作为当前人工智能领域最为流行的算法架构,Transformer近年来在自然语言处理、图像生成等诸多领域展现出了出色的性能。
从GPT系列到PaLM、LLaMA再到最新的ChatGPT,这类基于Transformer的大模型无疑是AI发展的主角。

然而,传统的GPU架构在运行这类Transformer模型时,却存在着严重的效率问题。
英伟达H100虽然最大FP16/BF16计算能力高达989 TFLOPS,但其中只有3.3%的晶体管用于矩阵运算,绝大部分资源都用于支持其他类型的AI算法,导致Transformer算法利用率并不高。

而Etched公司则打造的Sohu芯片恰恰瞄准了这一痛点,专门针对Transformer架构进行了深度优化。
作为业内首款Transformer专用ASIC(应用特定集成电路)芯片,Sohu将Transformer计算的关键优化硬化在了芯片之中,从而大幅提升了针对Transformer算法的运算能力。

具体来说,Sohu通过减少控制流逻辑、增加数学运算单元等手段,实现了超过90%的FLOPS利用率,远高于GPU上运行TRT-LLM时的30%水平。
这意味着在相同硬件资源下,Sohu能够输出大幅超过传统GPU的计算能力。

数据显示,一台搭载8块Sohu芯片的服务器,其运行Llama 70B模型的速度可达H100服务器的20倍,甚至比3月才问世的顶配芯片B200还要快10倍以上。
这种巨大的性能提升,无疑为当前大模型的应用,特别是在视频生成、音频生成等领域,带来了新的机遇。

"如果未来Transformer不再是主流,那我们就会灭亡。
但如果它继续存在,我们就会成为有史以来最大的公司。
"Etched公司CEO Gavin Uberti的这番话,无疑将Sohu芯片的命运与Transformer算法的地位紧紧捆绑在了一起。

软硬协同,突破传统AI芯片研发困境

对于大多数AI芯片初创公司来说,最大的挑战往往不在于硬件本身,而是在于如何开发出真正高效运行AI模型的软件和驱动。
不管是AMD、Intel还是其他第三方AI芯片,在软件层面上都花费了数十亿美元,但收效甚微。

但Etched公司却选择了一条截然不同的路径。

作为一款专门针对Transformer算法设计的ASIC芯片,Sohu的软件开发得益于其高度专用化的硬件架构。
Etched团队表示,由于Sohu只需运行Transformer,因此软件开发相对要简单得多,甚至可以做到全面开源。

这不仅意味着Sohu拥有更加精简高效的软件栈,同时也为用户提供了充分的定制化空间。
不同于传统AI芯片的"黑盒"模式,Sohu的开源软件让用户能够自由调整Transformer层等底层组件,大幅提升适配性。

更为关键的是,Etched公司在硬件和软件层面的深度优化,使Sohu芯片能够真正发挥出Transformer算法的全部潜能,最大化利用芯片资源。
这不仅体现在运算速度的大幅提升,也体现在内存带宽使用效率的大幅提升。

以Llama 3 70B模型为例,Sohu通过巧妙的批处理技术,让每个batch的计算密集度大幅提升,从而大大缓解了内存带宽的瓶颈问题。
这种软硬协同的设计理念,无疑是对传统AI芯片研发模式的一次彻底颠覆。

正如Etched运营主管Robert Wachen所说:"整个技术的未来将取决于算力基础设施能否实现大规模。
"而Sohu芯片的横空出世,无疑为这一目标提供了全新的思路和解决方案。

"硬件+软件"全面优化,势必将帮助Sohu芯片在AI计算加速领域占据一席之地,并为人工智能的发展注入新的活力。

勇敢的"哈佛辍学生"与其颠覆性创新

回顾Etched公司的创立历程,不难发现其团队成员的身份相当"特殊"——他们大多都是来自哈佛大学的辍学学生。

这在一定程度上打破了人们对于科技公司创始人的固有印象。
通常情况下,我们更习惯于看到那些来自顶尖大学、拥有丰富从业经验的"大佬"们站在科技公司的领导层。
而Etched却选择了一条不同的路径,凭借一群95后的"清流"们,在AI芯片这个领域掀起了轩然大波。

之所以会

:

Etched公司之所以能在这个领域取得如此突破性进展,其团队成员的背景也起到了关键作用。

这支由"哈佛辍学生"领衔的年轻团队,凭借着敏捷、进取的精神,在AI芯片研发上展现出了超乎寻常的洞察力和创新力。
他们不满足于现有的技术路径,而是主动突破常规,针对Transformer算法的特点进行了深入优化,最终打造出了这款被业界誉为"革命性力作"的Sohu芯片。

相比之下,那些身

背着名校背景、经验丰富的"大佬",往往难免会囿于既有思维定式,难以跳出固有模式。
而Etched的年轻创始团队,正是凭借对行业未来发展趋势的敏锐洞察,以及勇于试错的创新精神,才得以在这个领域占得先机。

正如Etched运营主管Robert Wachen所言:"如果未来Transformer不再是主流,那我们就会灭亡。
但如果它继续存在,我们就会成为有史以来最大的公司。
"这种对技术发展方向的深度把握,以及为之奋斗的决心,正是这支年轻团队的独特优势所在。

当然,Etched能够在如此短时间内取得如此成就,也离不开其他一些关键因素的支持。
比如他们得到了来自Peter Thiel、Cruise联合创始人Kyle Vogt等知名投资人的大量资金注入,为Sohu芯片的研发提供了充足的资金保障。

同时,Etched凭借自身的技术实力,也赢得了不少知名公司的青睐。
据悉,在Sohu芯片发布之际,该公司就已经获得了数千万美元的硬件预订。
这也预示着,一经推出,Sohu芯片或将受到广泛市场的热烈追捧。

可以说,Etched的崛起,不仅标志着一支90后"清流"在AI领域掀起的新一轮技术革新,也代表着业界对于年轻人创新力的高度认可和重视。
他们用自己的实际行动,向世人证明了,敢于突破常规、勇于实践的创新团队,同样有资格在科技领域书写传奇。

展望未来,Sohu芯片的成功无疑将为当前人工智能的发展注入新的动力。
随着大模型应用范围的不断拓展,对算力需求的持续攀升,专用AI芯片必将成为促进行业进步的关键力量。
而Etched凭借Sohu这款"革命性力作",有望成为引领这一趋势的重要推动者。

人工智能的未来,正由这群敢于颠覆的"哈佛辍学生"们所书写。
我们不难预见,Etched及其Sohu芯片,必将成为AI时代最耀眼的明星。

相关文章