麻痘2023,故乡里的中国丨千里骑行后，父亲的“心事”

麻痘2023

“总的来说，我认为推动效率的创新是一件好事。”在回答一位分析师关于DeepSeek的人工智能模型将如何影响苹果利润率的问题时，库克说：“你知道，这就是你在模型中看到的。”

影驰 GeForce RTX 5080圣刃OC显卡配备的七热管三风扇散热系统，长时间连续360W的功率释放下温度也能控制在66度左右，风扇转速只有1800RPM，三折扇叶的霜环风扇噪音控制的非常好，基本上注意不到风扇的噪音。，故乡里的中国丨千里骑行后，父亲的“心事”

DeepSeek的开发成本与美国企业的大模型相比大幅降低，在于应用了不同的模型训练模式，打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上，OpenAI选择了“人海战术”，堆砌算卡、将资源集中在算力，用海量数据投喂实现能力的提升。而DeepSeek选择了另外一种方式：利用算法把数据进行总结和分类，经过选择性处理之后再输送给大模型，最大优化算力，实现了成本的降低和模型性能提升。目前看Meta（脸书母公司）耗费了大量资金训练自己的人工智能模型Llama，但在效果上却没有成本极低的DeepSeek效果好。Meta高层已经在思考其员工是否在浪费公司资金，而这也引发了不少技术人员的恐慌，他们担心自己的技术能力和创新性被质疑，从而失去工作。

麻痘2023

这个春节，DeepSeek带来的更大的价值在于，它让全世界都明白，你一直被美国拿捏，是因为你总是在他给你划出的道路上试图超越它——只要美国想挡在你前面，你就永远追不上他。

除夕夜，蛇年春晚如约而至。当电视机里传来熟悉的背景音乐，所有中国人仿佛就得到了信号：春节的时间，正式开始了。与其说这是我们多年来形成的条件反射，不如说春晚的仪式感已经深深嵌入了每个人的日常生活，成为生命中不可或缺的一部分。

不过多名业内人士表示，“蒸馏”虽然存在一定争议，但其实是大模型训练中一种常用的方法。由于训练复杂模型需要投入大量资源，并雇用专业人员教导模型如何生成符合人类表达方式的回答，耗钱耗时间，而“蒸馏”则可以避免这个问题。因此，无论是在中国还是美国，初创公司和学术机构使用ChatGPT等具有人类反馈优化的商业大语言模型输出数据来训练自己的模型，被视为一种普遍的、“默而不宣”的现象。

台湾中天新闻网在报道也注意到这首诗，“在这则约40秒的影片中，展示东部战区官兵武装情形，以及船舰、战机训练情况，影片最后以一首诗结尾，‘海空陆火仗吴钩，如影随形汇铁流，以武止戈非好战，王师德胜寄千秋。’而衬底背景则是一幅台湾地图。”

麻痘2023，故乡里的中国丨千里骑行后，父亲的“心事”