Oddbean new post about | logout
 Jeremy Nguyen博士的研究发现,自2022年底以来,“delve”这个单词在PubMed文章中的使用频率增加了约400%,这与ChatGPT的兴起时间相吻合。

根据《卫报》科技作家Alex Hern的理论,人类反馈RLHF可能导致AI在其输出中过度使用“delve”这个单词。

LLM公司将RLHF任务外包给全球南部的国家,如尼日利亚和肯尼亚,而受到文化影响。这些国家的英语使用者可能更倾向于使用正式或文学性的词汇,如“delve”。

就像AI在生成图像时,往往将时间设置为10:10,这是因为在它的训练数据中,钟表的图像经常显示这个时间。

https://t.co/Y62b2fJB9y

数据!数据!又是训练数据集的问题~