这个春节应该是被 DeepSeek 引爆了,所有的人都在讨论,懂的不懂的,听说过的。炒股票的,都在讨论。搞技术的在讨论怎么自用,炒股票的在讨论创业版进不了场之类的。DeepSeek 的 APP 里各种 语境的回复,都被 玩成了花。
割韭菜的就是在拼命说,现在可以本地部署了,部署了你也就有一个自己的 R1 了,然后什么基于 Ollama 的各种教程、课程遍地都是,其实都只是自嗨罢了。本地部署?呵呵。。。。
看一下 Ollama 的页面:https://ollama.com/library/deepseek-r1:70b/blobs/4cd576d9aa16,70b 的,都是基于:DeepSeek R1 Distill Llama 70B 进行蒸馏的。那些普通人的机器能跑起来的所谓的 7b/8b 的,也不过是 QWen 或者 Llama 7b/8b 的蒸馏版罢了。Ollamah 写的很明白。
DeepSeek's first-generation of reasoning models with comparable performance to OpenAI-o1, including six dense models distilled from DeepSeek-R1 based on Llama and Qwen.
仔细看好那个下拉列表,只有 671b 的模型才是 R1 的。。。你觉得你跑得起来?别激动了,用用 API 就行了。反正也没那么贵。对比 openai/claude,真的便宜多了。而且付费也方便。