训练数据集有多重要,看OpenAI工作人员的博客所写: “当您提到“Lambda”、“ChatGPT”、“Bard”或“Claude”时,您指的不是模型权重。而是数据集。” 可理解为:不同LLM模型能力和效果差异,其实是数据集差异。 https://pbs.twimg.com/media/GOVDYtAbwAAEzNp.jpg