第396章 DeepSeek问世

这两天李宸开始着手规划火星计划的初步框架,一个来自深度求索公司的紧急电话打断了他的工作。

“李总!成了!DeepSeek成了!”电话那头,章博宇的声音激动得几乎破音,背景里还能听到团队成员的欢呼声。

李宸立刻放下手中的文件:“具体说说。”

“我们刚刚完成了最终测试!”章博宇语速飞快,“基于您提供的初始思路,加上后续您指导的自适应初始化策略和动态梯度裁剪,DeepSeek在各项基准测试中全面超越了GPT!”

他继续汇报着具体数据:“在MMLU多任务语言理解测试中,DeepSeek达到了92.1%,比GPT高出20个百分点;在代码生成任务中,HumanEval得分87.3%,超过了GPT的84.2%;更重要的是,我们的训练成本比传统架构降低了45%,推理速度提升了一倍以上!”

这些数字并没有让李宸感到很惊讶,毕竟如今的GPT只是第一代,而经过他指导的DeepSeek可是能和GPT-4掰手腕的,打个小弟不是轻轻松松?

“而且,”章博宇继续说,“我们在您提出的合成数据训练方法基础上做了优化,现在模型在数学推理和科学问题解答上的表现,简直像是......像是拥有了您的一部分智慧!”

李宸微微一笑,这或许就是100点智力带来的间接影响,他在指导团队时提出的那些思路和方法,确实融入了自己独特的思维方式。

“准备发布会吧,”李宸果断决定,“尽快。”

两天后,深度求索公司在国家会议中心召开了盛大的发布会,能够容纳上千人的会场座无虚席,来自全球各地的科技媒体、投资人和业界专家齐聚一堂。

能有这么多资深的专家来全是因为这是李宸的公司,现在全世界都在关注这个华夏天才的一举一动。

章博宇作为CEO主持发布会,当他宣布DeepSeek的各项性能指标时,台下先是死一般的寂静,随即爆发出难以置信的惊呼声。

一位来自OpenAI的技术专家失声喊道:“这不可能!”

他们作为人工智能的先行者,本以为DeepSeek只是一款模仿他们的作品,能达到80%的性能就很好了,没想到直接被超越了。