我们都知道,现在股价是遏制量化交易发展的,于是他在2023年转型了,就搞了DeepSeek,结果一年多时间就直接在地球上“爆炸”了!可谓是震惊环宇!整个美国或者说整个世界都蒙了!
说起来也有些冷幽默,梁文峰成立的量化基金是通过数量模型的计算寻找投资机会,因此对数据尤为敏感,其高频交易的特点更是离不开机器学习。为了从海量数据中挖掘投资机会,幻方量化早早开始囤积算力,先后斥资10亿元,在美国对芯片出口管制前购买了1万张英伟达A100型号GPU。机缘巧合下,幻方量化成为国内GPU算力最充足的企业之一,结果没想到的是,量化交易没有用满这些资源,反而成了其DeepSeek爆发的基础。
很显然,我们和美国比算力是比不过的,于是梁文峰团队独辟蹊径,走了一条和Open AI完全不同的路子。OpenAI是最早的AI模型规则制定者,它定下来的AI模型四个环节被认为是人工智能的铁律,包括:预训练、有监督微调、奖励建模和强化学习。就是说,Open AI模型的四大环节是不可少的,预训练出来的模型必须得在监督下不断微调,然后持续进行训练的。但是,梁文峰团队的模型直接将四个环节改成了三个环节,把有监督微调给去掉了,换句话会所就是DeepSeek不是在“老师”监督下来完成训练,而是自己自动训练,即无监督式微调(SFT)。