雷军千万年薪争夺未来科技新星! 95后AI女神惊艳科技界 (雷军千万年薪了吗)

近日,AI领域迎来了一项令人瞩目的成就,由95后AI天才少女罗福莉参与研发的DeepSeek,V3模型问世,并迅速成为业界关注的焦点,罗福莉作为关键开发者之一,在DeepSee...

近日,AI领域迎来了一项令人瞩目的成就,由95后AI天才少女罗福莉参与研发的DeepSeek-V3模型问世,并迅速成为业界关注的焦点。罗福莉作为关键开发者之一,在DeepSeek-V2项目中就已崭露头角,而今更是被小米创始人雷军以千万年薪招至麾下,即将领导小米AI实验室的大模型团队。

DeepSeek-V3的参数量达到了惊人的671B,激活参数为37B,预训练token量高达14.8万亿。这款模型在多项评测中超越了阿里的Qwen2.5-72B和MetadeLlama-3.1-405B等开源模型,在性能上与全球顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不相上下。

令人震惊的是,中国AI公司DeepSeek在训练大语言模型的同时,预算却异常低。前OpenAI联创及知名AI科学家Andrej Karpathy在社交平台上表示,DeepSeek-V3的整个训练过程仅使用了不到280万GPU小时,与Meta旗下顶尖开源模型Llama-3405B的3080万GPU小时相比,显示出了极致的效率。

在成本对比上,如果以H800的租金为每GPU小时2美元计算,DeepSeek-V3的总训练成本仅为600万美元左右,是Llama-3405B超6000万美元训练成本的十分之一不到。这一极高的性价比,使得DeepSeek-V3一经发布便获得了国内外的广泛关注。

Meta的AI研究科学家田渊栋称赞DeepSeek-V3在预算极为有限的情况下实现了强劲的表现,是一项了不起的工作。知名AI数据公司ScaleAI的创始人兼CEO Alexandr Wang也表示,DeepSeek-V3的训练所需计算量减少了10倍,展现了更低的成本、更快的速度和更强的实力。

DeepSeek,被誉为AI界的拼多多,由国内知名量化资管巨头幻方量化于2023年创立,专注于开发先进的大语言模型和相关技术。DeepSeek并非首次出圈,其半年前发布的DeepSeek-V2就已经因其性能达到GPT-4级别,开源、可免费商用且API价格仅为GPT-4-Turbo的百分之一而引起业内关注。

DeepSeek能够在性价比上做到如此之高,官方解释称,V2采用了创新的架构,比如注意力机制方面的MLA(多头潜在注意力)和前馈网络方面的DeepSeekMoE架构等,以实现更高经济性的训练效果和更高效的推理。

DeepSeek也是国内最早开启大模型降价的厂商,引领了大模型价格战的源头和推动者。在其发布DeepSeek-V2之后,字节、阿里、百度等厂商纷纷跟进降价。同时,DeepSeek也是中国互联网大厂以外,唯一一家储备了万张A100芯片的公司,为其早期的技术研发提供了坚实的算力基础。

DeepSeek创始人梁文锋在回应为何打响大模型价格战第一枪时表示,他们并非有意成为一条鲶鱼,而是不小心成了一条鲶鱼。这位毕业于浙江大学电子工程系的80后,一直潜心研究技术,保持着低调的工作作风,与所有研究员一样,每天看本文、写代码、参与小组讨论。

一名人工智能行业资深业内人士分析称,DeepSeek以200人左右的小团队,且不依靠外部融资,做出了一个有性价比并被全球主流AI界人士所认可的大模型。他们之所以能做到这一点,一方面是因为在早期就购买了很多算力卡,投入了大量资源进行研究;另一方面,他们专注于量化领域,不像大厂有其他各种各样的盈利需求,也与他们不构成竞争关系,因此能更专注于模型开发。

本文来自作者[shyfzc]投稿,不代表艺帆号立场,如若转载,请注明出处:https://vip.shyfzc.com/zixue/202412-26529.html

(1)

文章推荐

发表回复

本站作者后才能评论

评论列表(4条)

  • shyfzc
    shyfzc 2024年12月30日

    我是艺帆号的签约作者“shyfzc”!

  • shyfzc
    shyfzc 2024年12月30日

    希望本篇文章《雷军千万年薪争夺未来科技新星! 95后AI女神惊艳科技界 (雷军千万年薪了吗)》能对你有所帮助!

  • shyfzc
    shyfzc 2024年12月30日

    本站[艺帆号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • shyfzc
    shyfzc 2024年12月30日

    本文概览:近日,AI领域迎来了一项令人瞩目的成就,由95后AI天才少女罗福莉参与研发的DeepSeek,V3模型问世,并迅速成为业界关注的焦点,罗福莉作为关键开发者之一,在DeepSee...

    联系我们

    邮件:艺帆号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们