连AI大模子也运行“卷”价钱了,此次举起“砍价屠刀”的搅局者,莫得科技巨头加捏,也莫得互联网大厂配景,而是和幻方这家量化私募有着千丝万缕联系。
日前,深度求索开源第二代MoE大模子DeepSeek-V2,顶着“价钱屠户”的称呼一炮而红——性能并列GPT-4、价钱仅有GPT-4的近百分之一。
值得防范的是,DeepSeek出品公司是杭州深度求索东谈主工智能基础时候扣问有限公司(以下简称“杭州深度求索”),此前多家媒体报谈流露,深度求索为幻方旗下组织机构。且幻方量化曾在客岁4月发布公告称,将全力投身到东谈主工智能时候之中,诞生新的寂然扣问组织“深度求索”。
另据天眼查数据流露,杭州深度求索的背后为幻方量化实控东谈主梁文锋,后者在杭州深度求索最终受益的股份比例超简略。
性能方面,DeepSeek-V2领有2360亿参数,其中每个token210亿个活跃参数。据官网先容,DeepSeek-V2中语玄虚才气(AlignBench)“在浩荡开源模子中最强”,向上GPT-4,与GPT-4-Turbo,文心 4.0等闭源模子在评测中处于兼并梯队;英文玄虚才气(MT-Bench)与LLaMA3-70B处于兼并梯队,向上最强MoE开源模子Mixtral8x22B。
算力需求方面,分析机构SemiAnalysis指出,DeepSeek-V2锻练参数目达8.1万亿个token,而发扬出“难以置信”的锻练限度,谈论量仅为Meta Llama 3 70B的1/5,更唯有GPT-4 的1/20。
淌若说上述这些仅仅AI时候迭代波澜中常见的“时候炫技”,那么价钱则是该模子最激勉轻柔的重心。
现在DeepSeek-V2 API订价为:每百万token输入1元、输出2元(32K高下文),仅是GPT-4的近百分之一水平。
SemiAnalysis给出了“低廉得难以置信”的评价。据该机构谈论,在其算力工作力诈欺率最高的情况下,恒指期货交易DeepSeek每台工作器每小时收益可达35.4好意思元,毛利率在70%以上。
幻方量化,这家堪称量化界“四大天王”之一的私募,处分限制曾一度飙升至千亿,但之后幻方家具大幅回撤,处分限制也赶紧缩水。客岁年末,幻方还遭投资者控诉称,“花100万元买了幻方量化的家具两年多,赎回时只剩约80万元,还要被计提3万多的事迹答谢”。
幻方量化客岁4月公告诞生“深度求索(DeepSeek)”之后,深度求索发布了第一代大模子,并将免费商用,填塞开源。
彼时,幻方量化的公告曾在业内激勉“AI炒股说”的商量,但幻方量化董事总司理陆政哲示意,“我用中语重申一下:AGI不是用来炒股的,有大得多的用处和大得多的价值。”
在此之前,幻方量化已于2019年投资2亿元自主研发深度学习锻练平台“萤火一号”,搭载了1100块GPU;2021年幻方量化对“萤火二号”插足加多到10亿元,且搭载了约1万张英伟达A100显卡——亦然在那一年末,OpenAI的ChatGPT横空出世,掀翻内行AI激越和英伟达GPU“抢购潮”。
值得一提的是,为了插足东谈主工智能,幻方还租下“20个网球场”。客岁末有媒体报谈称,北京深度求索东谈主工智能(以下简称“北京深度求索”)正在进行装修招标,办公室选址于北京海淀区融科中心,装修工程面积达1950平素米,并赢得了施工许可证。
而天眼查流露,北京深度求索则由上文提到的杭州深度求索100%控股。