Oddbean new post about | logout

Notes by 向阳乔木 | export

 播客嘉宾推荐了一些书和电影电视剧:

《白城魔鬼》 (Devil in the White City):  作者埃里克·拉森 (Erik Larson),讲述了 1893 年芝加哥世界博览会期间发生的真实故事,将历史事件与连环杀手的故事交织在一起,引人入胜。

《丘吉尔时刻》(The Splendid and the Vile),讲述了丘吉尔在二战期间领导英国的故事。

《人类简史》 (Sapiens): 作者尤瓦尔·赫拉利 (Yuval Noah Harari),还推荐了《人类简史》的漫画版和儿童版。

影视作品:

《幕府将军》 (Shogun):  故事背景设定在 17 世纪的日本,讲述了一位英国水手漂流到日本后,卷入日本战国时代的故事。(我感觉讲的是Netflix上的那部剧)

《沙丘》 第一部和第二部。 
 刚听了42章经两天前的一个播客,讨论Copilot和Agent

https://t.co/lwolPjwbsx

Copilot 是工具,Agent 是劳动力。—Copilot 是减少你打字... Agent 是一个独立完成任务的个体"

Copilot 同步工作,Agent 异步工作。— "Copilot 是个同步的,就是说你用的时候人必须在场...Agent 跟人的工作是异步的,它人可以睡觉,人可以不在"。

不看好 AI Coding 的平民化,普通人缺乏写代码的需求。

程序员职业不会消失,但需求量和类型可能会发生变化。 
 最早认识 @op7418 (歸藏)也是机缘巧合,谷歌搜ChatGPT,找到这份AIGC周刊,如获至宝。

后来发现他的Twitter,私信邀请成为fingerfly访谈嘉宾。

记得那次的访谈嘉宾还橘子  @oran_ge ,主持人七娘 @GlocalTerapy 祥叔 @fuxiangPro 

歸藏老师是AI圈最卷,最认真的一批科普达人。另外还有宝玉(@dotey )、小互 @imxiaohu 等

不知不觉,离ChatGPT发布已经过去很久。

以前大家对 AI 资讯如饥似渴,随便发,只要跟AI有关,浏览量都是几万,几十万,现在数据惨淡。

这种反差下,仍然坚持发AI干货的人,绝对靠的是热情和信仰。

所以,强烈推荐歸藏的小报童,为持续交付价值的人点赞、打赏~

点击以下链接购买或看图微信扫码。
https://t.co/l8xTc24Cxq https://pbs.twimg.com/media/Ga9GYEVbYAAOlU2.jpg 
 曾纠结于用什么程序建个人网站,上午测试了Hugo和hexo等静态网站生成工具,都很方便,也消耗资源少。

但对小白来说,安装配置成本还是有点高,虽然貌似很简单了。

另外发布方式太Geek,跟Obsidian打通后估计好很多。

想了想,还是用Wordpress简单些。 
 Wordpress的发布功能太花哨了。

还是喜欢用Markdown写作发布,推荐这个第三方插件

支持粘贴HTML为MD格式,且能实时预览。

https://t.co/fBsus7OIS3

可惜,不知道为什么被官方临时下架了。 https://t.co/9V5BjWHI4h https://pbs.twimg.com/media/Ga9AlVFbsAAU-hi.jpg 
 发现个超实用的Chrome插件,飞书文档一键下载为Markdown文件。

自动下载页面图片、音频、视频,改成本地引用,最大限度保证排版。

https://t.co/RYPZcAuiyk https://pbs.twimg.com/media/Ga8ZIFZb0AAGu7q.jpg 
 AI总结万维纲推荐的小说:

历史穿越类
1. 《绍宋》 (作者:榴弹怕水)
• 推荐理由:擅长描写大型战争场面,具有史诗感
• 特点:探讨大宋人才未能发挥才能的深层原因,引发读者思考

2. 《终宋》 (作者:怪诞的表哥)
• 推荐理由:展现了北方汉人在蒙古统治下的真实心态
• 特点:对历史局势有独特见解

3. 《窃明》 (作者:灰熊猫)
• 推荐理由:首创将欧洲军事技战术引入中国的写法
• 特点:对历史人物有新颖的解读,引发热议

4. 《晚明》 (作者:柯山梦)
• 推荐理由:完成度极高,最像"真小说"
• 特点:对晚明市井生活描写生动,塑造了生动的小人物

5. 《大清话事人》 (作者:忧郁笑笑生)
• 推荐理由:探讨清朝闭关锁国的深层原因
• 特点:重点描写海贸和经济发展

6. 《晋末长剑》 (作者:孤独麦客)
• 推荐理由:历史细节真实
• 特点:对社会风貌、政治局面等有细致描写

修仙奇幻类
1. 《道门法则》《道长去哪了》《乌龙山修行笔记》 (作者:八宝饭)
• 推荐理由:构建独特的中国风修仙世界
• 特点:人物率直可爱

2. 《诡秘之主》 (作者:爱潜水的乌贼)
• 推荐理由:克苏鲁风格与蒸汽朋克的结合
• 特点:世界观完整,历史细节丰富

3. 《修真门派掌门路》 (作者:齐可休)
• 推荐理由:展现残酷真实的修仙世界
• 特点:写实风格,探讨生命和情感的本质 
 近两天在天津,发现很多服务已经接近无人化。

昨天,携程随便定了个loft公寓,到店发现没有前台,只贴了一张入住指南,旁边是个带人脸识别的机器,先刷身份证,然后扫码添加企业微信号,自动推送房间号和电子锁密码、WiFi账号等信息。

今天,河西区找了个自习室,下单,选座,开门全在小程序完成.. 
 今天6点起床,出海钓鱼。

登船点是个码头,车能直接开进去,幸好到的早,竟然还有停车位。

钓鱼装备精简,只有一个海钓保温箱和一根钓竿+纺车轮,其余都是领队帮准备,两个葫芦串钩(飘虾钓鲈鱼),两个梭鱼线组(3个串钩),活虾箱装一斤虾,另外有半斤水蚕和小药。

上船前被同船大哥笑话,因为我的装备是路亚专用,船钓并不合适,比如我的线是0.8号PE线,其他人都是8-10号粗的碳线或大力马线。

大哥很热心,把他的用线分了几十米给我。然后领队帮上线,绑钩子。

这里有一个感受,如果坦然承认自己是小白,立即会被照顾,示弱不都是坏事。

新手光环照耀下,不到10分钟就钓到了人生第一条海鲈鱼。

海钓依赖有经验的船长,他通过雷达探测器发现跟踪鱼群,在多个钓点之间开船转。

第三个钓点玩的最爽,平均每5分钟钓到一条梭鱼,没多会儿就钓到了快20条鱼。

先说操作,船边抛竿,铅坠到底后收紧虚线,凭借线的传导,感知是否有鱼咬钩,有口就提竿刺鱼。

可能是落潮的原因,中午后鱼口渐渐变少,于是一直在几个钓点之间转,几个小时没钓一条正经鱼,除了几条海鲶鱼,还有两个章鱼。

这里的感受是,干啥都有窗口期,有运气成分在里面。

昨天抖音上查了下梭鱼,很多人说不好吃,一股汽油味,肉不紧实,而且鱼必须清理掉内脏外的黑膜,做不好就会臭一锅。

问了领队,她说根本不是这样,天津这边产的梭鱼不一样,别名“筷梭”,无论做鱼丸还是红烧,味道都很好。有汽油味的梭鱼在塘沽那边,可能是污染和造成。

晚上到家做了一顿海鲜大餐,清蒸鲈鱼一条,红烧梭鱼四条,再用辣椒炒了两个章鱼,被孩子们吃的干干净净,成就感爆棚。

今天玩的有点high,下次带家人一起体验下。 
 已完成第二项和第三项任务。
明天执行第四项,第一项犯了拖延症。 
 上周六回字节参加了一次面向大学生的公益活动:AI成长训练营。

分享了一些 AI 基础知识,如常见的LLM和产品,Prompt Engineering,又一起体验几个图片、音乐、视频生成工具。

最后简单讲了下Coze工作流搭建。

大家学习热情高涨,提了不少问题,虽然很小白,但眼睛里看得出是真感兴趣。

PPT和飞书文档在这里:https://t.co/2mHBN0day8 https://pbs.twimg.com/media/Gaf02eKbEAAFVlU.jpg 
 从神经科学视角的看,什么是学习:学习就是突触的强度变化、新建或移除。

我只记得初中生物学过,神经元由细胞体、树突、轴突、突触组成,老师没教,自己也没想过工作原理。

今天配合AI和谷歌图片搜索、Youtube,简单研究了下,发现有点意思!

细胞体(Soma):神经元中心部分,可想象为神经元的“大脑”,它会整合树突传过来的信号,决定是否继续传递(形成动作电位)。

树突(Dendrites):从细胞体延展,接收其他神经元传递的信号(来自上一个神经元的突触),形状像一片树林(面积大),每棵树顶部都有“树突棘”,用来接收信号。

轴突(Axon):形状像一条电缆,甚至有1米以上,用来传递电脉冲。外面包裹一层髓鞘,可以理解为电缆外皮,越厚质量越好,传递信号越快。

突触(Synapses):与另外一个神经元的连接点,可以理解成,没有外皮,散开的“电缆线”。

学习和记忆,就是建立大量神经元之间的连接,传输信号。

水平高低,熟练与否,看神经元连接的广度和信号传递速度。

注意:神经元之间不是无缝直连接的,信号传递过程像接力赛,神经元内用电信号传递,到突触时释放神经递质(化学信号),下一个神经元接收后再转化成电信号,类似:电信号->化学信号->电信号.. 一直接下去。

科学表述:电信号(动作电位)沿轴突传导,到达突触前膜,触发神经递质释放(化学信号),神经递质跨越突触间隙,与突触后膜受体结合,引发突触后神经元的电位变化,如果达到阈值,产生新的动作电位,继续传递。

突触的连接强度,随使用改变,可以长期增强(LTP),也可以长期变弱(LTD)。

突触传递出Bug,可能会关联(造成)很多神经系统疾病,比如阿尔兹海默症、自闭症、精神分裂等等。

阿尔茨海默病:突触丢失和功能退化
自闭症:突触发育和功能异常
精神分裂症:突触修剪过度和神经递质失衡

跟学习最相关的三个东西:

1. 突触可塑性:突触连接强度的动态调节。
2. 新突触形成和修剪:神经网络的重组。
3. 髓鞘化:增强信号传导效率。

神经元连接的广度高、信号传递快、可塑性强,学习和记忆效果就好。

基于以上特点,AI给出的行动建议:

① 多样化学习(促进神经元连接的广度和复杂性):学习不同领域知识,尝试新方法,多思维活动(逻辑、创意、分析等),小组讨论脑暴等。

② 重复和练习(强化突触连接):间隔复习,回顾和应用,针对性刻意练习。

③ 深度学习(促进新突触形成):深入探讨主题,与已有知识连接,教授他人,加深理解。

④ 充分休息(支持神经网络重组和巩固):学新内容后要充足睡眠,学习之间安排短暂休息,练习冥想,让大脑消化信息。

⑤ 物理运动(促进髓鞘化和神经可塑性):定期有氧运动(跑步,游泳),尝试协调性运动(舞蹈、球类)

⑥ 健康饮食(支持神经系统健康):吃omega-3脂肪酸(如鱼类),足够蛋白质摄入,吃含抗氧化剂的水果和蔬菜。

⑦ 挑战自我(刺激神经网络的可塑性):设定高于当前水平的学习目标,解决复杂问题,学习新语言或乐器。

⑧ 利用多感官学习(增加神经连接的复杂性):视觉、听觉、触觉学习,用图表等可视化,动手实践。

⑨ 正念练习(增强注意力和神经可塑性):专注力训练,培养专注和觉察能力。

最后推荐哈佛出的一个视频,演示了神经元如何工作:https://t.co/bUOe95rMEf https://pbs.twimg.com/media/Gafclrha0AAxWxy.jpg https://pbs.twimg.com/media/GafibfQbEAUKhaP.jpg https://pbs.twimg.com/media/Gafi5hkbEAAWk3m.jpg 
 读了三分之一,摘录的一些句子:

- 你能帮到的人才是你的人脉

- 人只能与“对自己有需求的人”建立关系。

- 产品价值 = 功能价值 + 情绪价值 + 资产价值

- 功能价值满足基础需求和效率需求。

- 功能价值有4个模型:原材料/劳动力模型、专利/IP模型、平台/供应链模型、基础设施模型。

- 新的基础设施,带来新的效率和可能性,解锁上一代的“无能为力”。

- 我们之所以为功能付费,是想要更高的效率。如果对效率满意,不需要新功能。

- 情绪价值 = 生理唤起 + 认知标记 + 心理账户

- 生理唤起和认知标记决定了情绪的产生,心理账户决定了用户是否会付费和付多少。

- 创造功能价值需要工具思维,创造情绪价值需要玩具思维。

- 商品演化趋势:工具越来越集成,情绪消费越来越多。

- 如果说世界的本质是能量、物质和信息,那么品牌的本质是信息。

- 品牌 = 一代代的产品 + 公共记忆 + 时间过滤

- 可口可乐的最初配方:可卡因 + 咖啡因 + 糖 + 气泡水

- 戴比尔斯大量广告投入,让钻石和“爱情”锚定,可口可乐大量广告投入,让可口可乐和“快乐”锚定。 
 昨天看到刘韧老师推荐,下单买了中关村才女梁宁老师的新书。

虽然道理不新,但逻辑和定义非常清晰,案例故事性也足够,属于好读的书,一小时就能读三分之一。 https://t.co/msNAPxSN6L https://pbs.twimg.com/media/Gaa38ZObQAAeslT.jpg 
 生命演化真神奇!

1. 热泉环境诞生RNA和DNA。(个人认可的假说,原书没这么讲)

2. DNA演化出脂质气泡,成为细胞雏形。

3. 细胞演化出蛋白质,像马达一样,让细胞运动起来,形成早期单核细胞,能量来源是氢(效率低)。

4. 单核细胞突变出“蓝绿菌”,通过光合作用获取能量( 光 + 二氧化碳 = 糖)。

5. “蓝绿菌”排出过多氧气对细胞有害(氧化衰老),演化出“有氧呼吸”细胞,它能消耗氧气和糖作为能量,排出二氧化碳。地球生态出现氧气和二氧化碳的平衡。

6. 光合作用消耗无尽的阳光和二氧化碳,生物种群竞争小。而“有氧呼吸”生物除了氧气,还需要来源于其他生物的“糖”,所以得“吞噬吃掉”别的生物。

7. 生存竞争压力下,演化出比单细胞大百倍的真核生物,成为动、植物和真菌共同祖先。

真核生物演化出三个分支:

① 植物:回归光合作用获取能量,就是现在的花草树木。

② 真菌:吃腐烂生物尸体,菌丝接触,外部消化,慢慢吸收。就是现在的蘑菇类。

③ 动物:吃新鲜生物,体内消化,快速吸收。

动物为了解决“捕猎”过程中各种困难,演化出存储食物的「胃」,运动的「肌肉」,捕猎规划和趋利避害的「神经元」,获得了最强的智能。 https://pbs.twimg.com/media/GaVsiIXbAAAJWwG.jpg 
 今天听万维纲解读《智能简史:进化、人工智能和造就我们大脑的五大突破》。

读到“线虫”也有“情感”,也会得“抑郁症”,原因来自两种生物化学的作用:多巴胺和血清素。

类比人,武断的提炼了一句:

多巴胺让人亢奋,追逐;血清素让人满足,躺平。

然后让AI解读,AI说:

“这个描述简化了多巴胺和血清素的作用,但确实捕捉到了这两种神经递质的一些关键特征。让我们更详细地解读一下:

多巴胺:
1. 奖励系统:多巴胺是大脑奖励系统的关键神经递质,与快感、动机和欲望密切相关。

2. 促进行动:它确实能让人感到兴奋和积极,推动人们追求目标。

3. 学习和记忆:多巴胺在学习和形成新记忆中也起重要作用。

血清素:
1. 情绪调节:血清素被称为"快乐激素",与情绪稳定和幸福感有关。

2. 放松效应:它确实能促进放松和满足感,但"躺平"这个说法可能过于简化。

3. 睡眠调节:血清素参与调节睡眠-觉醒周期。”

然后追问,什么可以获取多巴胺和血清素,AI回复:

多巴胺:
1. 设定和实现目标:完成任务会触发多巴胺释放。
2. 运动:特别是有氧运动可以增加多巴胺水平。
3. 听音乐:喜欢的音乐可以刺激多巴胺释放。
4. 冥想:某些形式的冥想可以增加多巴胺水平。
5. 新体验:尝试新事物可以刺激多巴胺系统。

血清素:
1. 阳光暴露:阳光可以促进血清素的产生。
2. 运动:规律的运动也可以增加血清素水平。
3. 饮食:含有色氨酸的食物(如鸡肉、火鸡、鸡蛋、奶酪等)可以帮助产生血清素。
4. 按摩:可以增加血清素和减少皮质醇(压力激素)。
5. 社交互动:积极的社交活动可以提高血清素水平。
6. 冥想和瑜伽:这些活动可以增加血清素水平并减少压力。

映射到生活的话,是不是就是多运动、冥想,追逐爱好和目标,晒晒太阳,吃点健康的? 
 听过几十集,非常认同,这套教材好! 
 小红书看了个评测,最后买了这款铁兔三合一充电器,可以折叠收纳非常小巧,同时充Apple Airpods、iPhone和iWatch,用了几天觉得很方便。 https://t.co/MhYWYgfUCS https://pbs.twimg.com/media/GaVkpDbbYAA4mHx.jpg 
 今天跟几个给ai公司提供数据的朋友吃饭,他们说巴基斯坦人最靠谱,然后是尼迫尔人,印度和菲律宾人特别懒。

乌克兰人也很好,战争让人民失业,有活干就很认真。

欧洲人民也不错,只要合同签好,会严格按标准甚至超标完成。

加拿大去了很多难民,也都踏实肯干活。

战争真的恐怖,还是和平好。 
 以前的担心多虑了,好怕小众产品关停。
团队给力,成重点项目了 
 安德鲁·休伯曼(Andrew Huberman),推荐的一个减压呼吸法:Physiological Sigh。

方法:用鼻子猛吸两口气
第一口比较慢,要让肺部充满
第二口比较短,最大限度给肺泡充气
然后慢慢地用嘴把气呼出。

据说只要做两三次就能减轻压力和焦虑。

我刚试4次循环,apple watch心率没变 哈哈哈! 
 搭好了!输入话题生成2-3分钟中英文播客。
https://t.co/GYsdwnYc1P

本来想用来学英语,输入英文故事URL,自动变双语,提炼单词/词组,生成英语播客。

故事来源 https://t.co/9WWwah4FkY

另外,生成科普知识音频也很棒~

孩子说“因数和倍数”掌握不好,1分钟生成音频,两个AI对谈讲解,清晰易懂。 https://pbs.twimg.com/media/GaGfFm-b0AAWyWI.jpg 
 把万维纲分享的神奇休息法,用AI做成中文播客介绍。

能感知到的一个未来趋势是,多种媒体之间的任意转换。

让文本学习者、音频学习者、视觉学习者都能找到最适合自己的素材学习。 https://t.co/S2umE4SVCN https://video.twimg.com/ext_tw_video/1846750018079977472/pu/vid/avc1/1280x720/-ogQF8VRFJeeYK_S.mp4?tag=12 
 用Coze搭建了工作流,把中文日记发给Bot,自动生成英文播客。

内容都是自己熟悉的,听两个AI老外讲出来,看人家怎么表达。

中文版体验地址:https://t.co/CZztHecKue

英文版还在调Workflow中 https://t.co/ZZfJKRzeLa https://pbs.twimg.com/media/GZ7slBOb0AEoScI.jpg https://video.twimg.com/ext_tw_video/1846172872542507010/pu/vid/avc1/1280x720/hyfurJAhYl2BCk7e.mp4?tag=12 
 感谢网友线索,这个现象叫“特罗克斯勒效应 Troxler effect”。

由瑞士医生Ignaz Paul Vital Troxler在1804年首次发现:

我们长时间注视一个固定点时,周边视野中的静止物体会逐渐变得模糊,甚至似乎消失的现象。

原理解释:
① 神经适应:长时间接收相同的视觉信息会导致神经元的反应强度逐渐减弱。

② 视网膜影响:视网膜中央凹(负责中心视觉)比周边视网膜更敏感。周边视网膜对静止物体的感知能力较弱,更容易受到适应的影响。

③ 注意力资源分配:大脑倾向于将注意力资源集中在我们主动关注的区域(如中心的十字),导致对周边信息的处理减少。

④ 填充效应:当周边物体"消失"时,大脑会尝试用周围的视觉信息来填充这个区域。这就是为什么消失的区域通常会被背景色"填充"(白色)。

⑤ 对比敏感度:视觉系统对对比变化更敏感,静止的图像缺乏对比变化,更容易被忽视。

视而不见,是因为神经元对周边静止不变化的东西“适应”了。大脑注意力资源有限,只能让视神经关注很小的范围,超过时会忽略和自动脑补。

这么看,“习以为常”是大脑的偷懒策略,有好处,也有坏处。 
 Coze官方提供的类似NotebookLM的音频播客生成。

https://t.co/gVoDe85BLc

试了下,效果一般(播客脚本有点尴尬,对话不如NotebookLM像真人),但能支持中文,提供任何微信公众号文章就能生成播客对话。

能复制官方Workflow到自己的账号下,研究Agent搭建方法。 https://t.co/NuLpVJfnGg https://pbs.twimg.com/media/GZ1c8dAbwAAH5qi.jpg 
 盯着看红点30秒,周围的绿色圈有个瞬间会消失。

大脑注意力有限,没有变化,大脑会忽略,有点神奇。 https://t.co/fn6KF4hyYv https://pbs.twimg.com/media/GZ0XLknbIAAWs_u.jpg 
 最新更新:Gemini 发布最好用的文生图产品 Imagen 3 
https://t.co/7lE9j8ICZD

官方宣称真实感、指令遵循更好,但测试感觉又没那么强?

比如让它生成一张9:16的iPhone 15 用的背景图。

实际图片永远是1:1大小(可能不支持宽高设置),且会把iphone放到图里,没get到用户想要什么。 
 网红AI工具“NotebookLM”的产品故事

NotebookLM 起源于谷歌内部一个名为"与小型语料库对话"的20%时间项目。

最初团队非常小,产品负责人Raiza Martin、一位工程师以及著名作家Steven Johnson 三人共同发起。

除了负责技术的工程师是全职投入以外,Raiza和 Steven Johnson 都只是利用 20% 的时间参与这个项目。直至产品发布前,团队人数都不超10人。

近期引爆互联网的亮点功能:音频概览(audio overview),将文本内容转化为播客形式,极大地提升了用户体验和趣味性。

这个功能内部称“Deep dive(深度解析)”播客。
团队发现,许多用户希望能够以更加便捷的方式获取信息,而音频形式则提供了一种更轻松、更具吸引力的选择。

最重要的产品需求来源是Steven Johnson,他是一位著名的作家、演说家和记者,著有 14 本书,并且是纽约时报畅销书作家。

他也是 Readwise的重度用户,拥有大约 8000 条摘录。

Raiza Martin 说:“我认为Steven就是产品,我将观察他的一举一动,并尝试找出如何利用技术来构建它。”

这个团队很像创业公司运作模式,跟用户贴的很近:

① 建立了拥有6万多用户的Discord服务器,用于分享使用体验和收集反馈。

② Raiza Martin积极使用Twitter与用户互动,关注用户评价。

③ 定期进行用户访谈,例如观察学生学习、了解专业人士的需求和痛点。

Raiza 的最终目标是将 NotebookLM 打造成一个功能强大的 AI 编辑服务,实现“任意输入,任意输出”的愿景。

比如支持处理各种信息,例如视频、音频、电子邮件、社交媒体内容等,转换成不同的输出格式,如博客文章、视频教程、聊天机器人等。

Raiza说目前还没有明确的商业模式,打算先构建有趣的东西。

下一步会开发移动应用,满足随时随地使用的需求。
还有给用户提供丰富的控制选项,比如音频内容的语气和深度等。 
 最近一期的a16z Podcast,探讨了人工智能 (AI) 语音技术最新进展及其对不同领域的影响,摘录一些观点

① 实时性是语音交互的关键,低延迟 (低于 300-400 毫秒) 才能创造与真人对话的错觉。

② 电话是与世界互动的 "API",实时语音技术将使更多人通过电话体验 AI

③ 语音是人类最古老、最自然的交流方式,但一直未成为与技术交互的主要界面。AI 正在改变这一现状,语音识别和处理技术的进步使 "语音编程" 成为可能。例如AI语音代理可以替代人工进行电话客服、预约等工作,还有AI语音伴侣和语言学习等应用也展现出巨大潜力。 
 帮加速,Twitter上正经分享有价值内容,做到十万粉丝,真的是个里程碑! 
 🤩小白也能写带界面的在线产品工具了~

从想法到上线只需要1分钟?

Gradio 的AI playground 生成代码和界面,一键发布到Huggingface。
https://t.co/yXqAAcK98S

一句话生成了个谷歌SEO关键词挖掘工具,体验地址
https://t.co/0f6k5CNkNN https://t.co/gyd6sLXENg https://pbs.twimg.com/media/GZf7CL1bsAEBAlF.jpg https://pbs.twimg.com/media/GZf7L3racAAB5lZ.jpg https://pbs.twimg.com/media/GZf7VOPbsAATptP.jpg 
 来来来,一起玩  https://t.co/L4rFi0berA 
 今天打车遇到3个司机,体验有好有坏。

第一个司机,一路跟朋友电话聊天,开车急刹急停,坐后排的我赶紧系上了安全带。

第二个司机,边开车边刷抖音,内容大意是夸中国导弹有厉害,说日本人(用“小本子”替代)屁都不敢放,扬言迟早要收拾“小本子”...

第三个司机有点奇特,一直安静开车,直到路上查酒驾,问我有没有喝酒才攀谈起来,从国际形势、股市涨跌聊到如何看幸福,他观点是“不以物喜不以己悲”的平静状态,有点意思!

他年龄50多岁,坚持冥想6年,前职业是凉菜、熟食商贩。

交流中感觉他很热爱学习,很阳光正能量,希望自己老的时候,也能做到这样。 
 播客价值不止是陪伴和环境背景音,它有稀缺性,拥有其他地方很难找到的特定领域知识。

干货少,“湿货”多,而特殊价值往往来源不干不湿的“东西”。

AI总结会丢掉情感和“湿货”,也丢掉了最独特的部分。

好播客可设置为1.5倍速提效,但还是建议从头听到尾。

AI生成播客,如能填补稀缺知识供给,也不是坏事。 
 人工智能还没改变世界,但已经改变了很多学科😂
感觉英文Twitter多数在嘲讽今年的诺贝尔奖...

“物理学家认为人工智能就是物理学。
统计学家认为人工智能就是统计学。
数学家认为人工智能就是数学。
心理学家认为人工智能就是心理学。
神经科学家认为人工智能是神经科学。
他们都很好。” 
 再次推荐Chrome插件暴力猴的翻译机脚本,可以把X feed都变成双语版,获取海外资讯更轻松。

1. 暴力猴插件安装  https://t.co/06FvVEnYZj
2. 翻译机脚本安装
https://t.co/DDEy9FQ1Xc

附图是效果。

另外如果对AI资讯感兴趣,可以关注这个纳瓦尔整理的关注列表 https://t.co/B4zIc4TZAS https://t.co/CIEVqt06Vv https://pbs.twimg.com/media/GZdiYLRbUAEjfIX.jpg 
 今天准备一个面对大学生的AI分享PPT,朋友希望教会大家用coze搭建一个学习辅助相关的agent,然后发布到豆包。

第二个任务是用豆包写歌词,海绵音乐作曲,即梦生成视频片段,做一个音乐MV。

如果感兴趣,我这两周写个详细教程出来。 
 人工智能发展史的一些关键里程碑:

1943年:沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮茨(Walter Pitts)提出了人工神经元模型,这是神经网络研究的基础。

1950年:图灵发表了《计算机器与智能》,提出了著名的“图灵测试”,即如果一台机器能在对话中让人类无法判断其是否为机器,则这台机器具有智能。标志着人工智能概念的萌芽。

1956年:在美国达特茅斯学院,由约翰·麦卡锡(John McCarthy)、马文·明斯基(Marvin Minsky)等人组织的会议上,首次提出了“人工智能(Artificial Intelligence)”的概念。这次会议被认为是人工智能作为一门独立学科的正式诞生。

1959年:亚瑟·塞缪尔(Arthur Samuel)开发了世界上第一个自学习程序——西洋跳棋程序,引入了"机器学习"这个术语。

1966年:约瑟夫·魏岑鲍姆(Joseph Weizenbaum)开发了ELIZA,这是一个早期的自然语言处理程序,能够模拟心理治疗师与人对话,揭示了机器与人类自然语言交流的可能性。

1969年:马文·明斯基(Marvin Minsky)和西摩·帕珀特(Seymour Papert)出版《感知器》一书,指出了单层神经网络的局限性,导致神经网络研究一度停滞。

1982年:约翰·霍普菲尔德(John Hopfield)提出霍普菲尔德网络,重新激发了对神经网络的研究兴趣。

1986年:大卫·鲁梅尔哈特(David Rumelhart)等人重新引入了反向传播算法,推动了多层神经网络的研究。

1989年:杨立昆(Yann LeCun)应用卷积神经网络于手写字符识别,这是深度学习在实际应用中的早期成功案例。

1997年:IBM的超级计算机深蓝(Deep Blue)击败了国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov),标志着AI在博弈领域的重大突破。

2006年:杰弗里·辛顿(Geoffrey Hinton)等人提出了深度信念网络(Deep Belief Networks),为深度学习奠定了基础。

2011年:IBM的Watson系统在美国的智力问答节目《Jeopardy!(危险边缘)》中战胜人类冠军,展示了自然语言处理和知识检索的强大能力。

2011年:苹果公司在iPhone 4S中引入了Siri,这是第一个广泛使用的智能个人助理。

2012年:杰弗里·辛顿的指导下,亚历克斯·克里泽夫斯基(Alex Krizhevsky)开发出AlexNet模型,在ImageNet图像识别竞赛中取得了显著的成绩,推动了深度卷积神经网络的发展。

2014年:伊恩·古德费罗(Ian Goodfellow)提出了生成式对抗网络(GAN),为生成模型开辟了新方向。

2016年:谷歌DeepMind的AlphaGo以4比1战胜围棋世界冠军李世石,这是人工智能在复杂游戏中的里程碑事件。

2017年:论文《Attention Is All You Need》提出了Transformer架构,革新了自然语言处理模型的设计,为后续的预训练语言模型奠定了基础。

2018年:谷歌发布了BERT(Bidirectional Encoder Representations from Transformers),这是NLP领域的一个重要突破,为后续的语言模型发展奠定了基础。

2019年:OpenAI发布了GPT-2,展示了大规模预训练模型在文本生成上的强大能力。

2020年:DeepMind的AlphaFold在蛋白质结构预测中取得重大突破,对生物学和医学研究具有深远影响。

2020年:OpenAI发布了GPT-3,拥有1750亿参数,进一步提升了语言生成和理解的能力。

2021年:OpenAI发布了DALL·E,可以根据文本描述生成图像,同时发布了CLIP,加强了图像与文本的联合理解。

2022年:Stable Diffusion和Midjourney等AI图像生成模型的公开发布,使得AI艺术创作变得更加普及。

2022年:OpenAI基于GPT-3.5架构,训练了对话模型ChatGPT,能够进行连贯的对话和回答问题,在全球范围内引起广泛关注。

2023年:OpenAI发布了GPT-4,具备多模态处理能力和更强的理解与生成性能,进一步推进了通用人工智能的发展。
... 
 海绵音乐+李煜《虞美人·春花秋月何时了》生成5种音乐风格。

歌词支持结构控制,可以配合Claude 写歌词,Prompt如下
---
你是AI音乐编曲大师,我提供一段歌词,然后参考下面结构重新编排:

示例
## 原始歌词:

记得那一天 那一天我们相恋

说好彼此都不说再见
遵守诺言 用心去相恋
我为你撑伞 你为我取暖
当我把心交给你的那一天
你却消失在我的眼前
事到如今已经过了好多年
是否你还像从前

## 编排后歌词:

(前奏)
(主歌)
记得那一天 那一天我们相恋
说好彼此都不说再见
遵守诺言 用心去相恋
我为你撑伞 你为我取暖
(间奏)
(副歌)
当我把心交给你的那一天
你却消失在我的眼前
事到如今已经过了好多年
是否你还像从前
(尾奏)

### 歌曲结构可用标签:

• 前奏:Intro,歌曲开始的音乐部分,主要用于引导歌曲的整体氛围。
• 主歌:Verse,通常在前奏之后,歌曲中叙述歌曲故事或主题的部分。
• 副歌:Chorus,一般在主歌之后,旋律有记忆点和感染力,是整首歌的高潮,进一步强化歌曲的主题和情感。
• 间奏:Inst,歌曲中的纯音乐段落,用于连接不同的演唱部分。
• 尾奏:Outro,歌曲结束后的音乐段落,用于营造歌曲结束的氛围。
• 桥段:Bridge,通常出现在歌曲中段或接近结尾处,是一个过渡部分,用于连接不同的歌曲段落。
---
下面是第一首歌词:
春花秋月何时了?
往事知多少。
小楼昨夜又东风
故国不堪回首月明中
雕栏玉砌应犹在,只是朱颜改。
问君能有几多愁?
恰似一江春水向东流。 https://video.twimg.com/ext_tw_video/1843672722855124992/pu/vid/avc1/1280x720/ZNNyNRtoSI1Me3tP.mp4?tag=12 
 查了下上门板的意思:
部队借老百姓的门板作床板,因各家门板尺寸不同,高矮大小不一,一大堆门板如果弄混了就对不上榫,难以安装回去。

所以规定用完门板要装回去。

很具体,很接地气.. https://t.co/FS9rzTyLb4 https://pbs.twimg.com/media/GZSlag8bEAEC3Jt.jpg 
 Buzzabout是一款用户需求洞察工具,免费版本支持Reddit,付费版本支持TikTok和Youtube的用户数据分析。

https://t.co/FOJQ8RcDQt

不用翻Reddit评论,输入关键词,就能大概用户痛点和关注点,还能AI Chat深挖。

这对PM、独立开发者和海外营销推广很有帮助。

产品设计也很聪明,有多步进度条和等待Tips,避免结果生成太慢,给用户掌控感。

比如搜索“English Learning Tools”,从结果看,大部分人对AI教育应用感兴趣,持正面乐观情绪,而且很重视发音准确性。

个性化学习和游戏化学习,参与讨论的人多,但情绪负向,这可能是痛点? https://pbs.twimg.com/media/GZC1lzhaAAAL6ds.jpg https://pbs.twimg.com/media/GZC2XrbboAALq25.jpg https://pbs.twimg.com/media/GZC4nWTbgAMceKO.jpg 
 豆包机器人已上架:https://t.co/iS8DE85A8n

使用方法,输入任何词汇或场景,自动生成图片和TTS音频,下载后可以用剪映合成视频。

Coze上没有好用的图片+音频合成视频插件,不能一步到位,略微遗憾。

不少网友建议把这个Bot变成App,感兴趣的程序员可以试试。 
 国庆假期到了,朋友们推荐了一些书,打算抽空翻翻:

①《大脑传》-马修·科布

② 《毛泽东传》-迪克·威尔逊

③《棋与人生》-加里·卡斯帕罗夫

④ 《给青年的十二封信》-朱光潜

⑤ 《真希望我父母读过这本书》-菲利帕·佩里

又重温了纳瓦尔关于读书的看法:

① 养成每天阅读的习惯,每天坚持比一次性大量阅读更重要。

② 选择你感兴趣的书,兴趣是最好的老师,不要执着于读好书,垃圾读物也能帮你找到真正感兴趣的领域。

③ 不要害怕阅读非主流书籍,即使不同意作者观点,也有助于帮你全面理解世界。

④ 与其读所有书,不如反复阅读一百本好书。

⑤ 阅读要和写作结合,把阅读收获提炼成简单的几句话,发到社交媒体跟人交流。 
 前几天败家的海钓装备到货:

纺车轮:禧玛诺 22款斯泰拉 2500SHG

杆子: 露娜米斯 S80M ,直柄中调2.44米

主线:禧玛诺Pitbull 12编 0.8 PE线 150米

前导线:西格之星 100 米

拟饵:店家送的铁板,前面一个单钩,后面一个三本钩带羽毛,做工不错。

在抖音搜索教程学习完成了轮子上线和绑前导线,耗时大约40分。

迫不及待开车到顺义高丽营星海钓场,真·试水。

为什么选这家钓场?一方面近,另一方面高德地图评分相对高,且还有付费教学。

花钱请老师是新手上路最快的方式,虽然以前玩微物,但对于重型远投装备,让有经验的人指导,一定比自己瞎折腾更少走弯路。

老板人不错,花了大概10分钟讲了下抛投技巧和控饵手法,一分钱没收,然后就让我开始实战。

经过练习,7克铁板抛投距离到 50米左右,一共钓到 6 条大口鲈鱼,尝试了好几种拟饵:铁板中鱼最多,然后是亮片,VIB和铅头钩T尾没钓上来。

亮片咬口最清晰,duang的一下,很刺激过瘾。

期待国庆假期天津海钓实战,目标:中一条鱼。 
 下午重温了新开服的暴雪卡片游戏《炉石传说》,一晃10年过去了。

充值128,分解了一张金色传说卡牌,配了个自残术牌组。

可惜,网易服务器没搞好,登录要排队15-20分钟,进去打一局必掉线,然后又要排队15分钟...

折腾了三回,热情都被磨光了... 
 打开两个Notebooklm浏览器tab,扩展屏分屏展示,一个看阅读摘要,一个对话提问。

主屏heptabase记笔记,raycast AI随时唤起查背景知识,相当完美。 https://t.co/D12FRhuBAG https://pbs.twimg.com/media/GYfghlWawAA6n-c.jpg 
 Tim ferris访谈畅销书作家伊丽莎白,她提到一个“双向祈祷”很有趣。

她三十岁时第一次离婚,非常绝望,人生处于低谷,为了让自己恢复,她开始尝试用朋友或亲人的口吻给自己写信,写下最希望别人对她说的话。

练习方法:
1. 找个安静的地方:随着练习时间变长,可以在任何地方进行。

2. 读些让你感到神圣的东西,有助于打开心扉。 比如哈菲兹、鲁米、玛丽·奥利弗或沃尔特·惠特曼的诗歌。

3. 只问一个问题。例如“亲爱的,你今天想让我知道什么?” 避免对话,因为这会让你的自我意识参与进来。

4. 第一行回复以一种爱称开始,例如“亲爱的”、“我的孩子”、“我的宝贝”。 伊丽莎白经常听到“我的小宝贝”这个称呼。

5. 写下你希望别人对你说的话,因为你知道自己渴望什么样的爱。

“双向祈祷”源于一个古老的精神练习,在12步戒瘾疗法中也非常常见。

避免问“为什么”这类问题(往往没有答案),多问一些以“如何”开头的、指向具体行动的问题。例如“你希望我如何度过这段时间?” https://pbs.twimg.com/media/GYfZypsaoAAvDQj.jpg 
 好奇,Mac上的类Spotlight效率工具,如果迁移到iOS会是什么产品形态,能解决什么问题? 
 前几天还想有没有社交媒体聚合发布工具,今天刷到一个Chrome插件叫“爱贝壳内容同步助手”,支持同步发动态、文章、短视频到多个平台。

免费版能发3条,付费版不限制,一年只需要60块,开发者定价很良心。

https://t.co/LCcptmicYT https://t.co/vALDBS6pRR https://pbs.twimg.com/media/GYe4gA0a8AE5W0W.jpg 
 我认为大多数最好的生活基于创造的冲动,而大多数最糟糕的生活源于对占有的热爱。 --罗素 https://t.co/wZvr9Kbfjg https://video.twimg.com/ext_tw_video/1839632787986604032/pu/vid/avc1/480x854/avGKf-HVVErOqWUX.mp4?tag=12 
 一步到位,直接上好装备,免得以后心痒痒升级花更多钱。(为败家找借口 😁) https://t.co/IQJElqrdQg https://pbs.twimg.com/media/GYaPVnYaMAgtWNn.jpg 
 终于读完《智人之上》,把epub转成pdf,传到Notebooklm对话总结。

Epub转PDF:https://t.co/tJ6Wyn9it2

NotebookLM:https://t.co/LF0cN1MmPE

天真的信息观
天真的信息观认为,信息的主要作用是呈现现实、揭示真相。

只要我们不断收集更多信息,并进行准确分析,就能更接近真理。但实际上,大多数信息并非为了追求真理,而是为了建立和维持社会秩序,这常常需要牺牲部分真相,例如:

① 官僚制度通过文件、档案、表格等形式,将信息标准化和分类,提高了社会运作效率,但也可能导致僵化和扭曲,忽视现实的复杂性。

② 神话故事通过构建共同的信念和价值观,将人们团结在一起,但也可能被用来掩盖真相,甚至成为权力滥用的工具。

印刷术和信息网络失控
印刷术的出现,使得宗教经典能够大规模复制和传播,打破了教会对知识的垄断,促进了个人主义和理性主义的兴起。同时,印刷术也促进了标准化语言的形成,有利于民族意识的形成和民族国家的建立。

然而,印刷术带来的信息爆炸也对传统的社会秩序构成挑战。例如,猎巫行动的兴起,部分原因就是印刷术的普及,使得关于巫术的书籍和谣言大量传播,加剧了社会恐慌和对异端的迫害。

民粹主义的危害
民粹主义者往往声称自己代表人民,将"人民的权力"绝对化,无视人民内部的多元性和利益差异。

他们不信任任何独立于"人民意志"之外的权威机构,包括法院、媒体和学术机构,认为这些机构是"精英阶层"的工具。

民粹主义者会试图削弱或控制这些机构,以消除对自身权力的制约。

然而,这些独立机构正是民主制度中重要的自我修正机制,能够有效地监督权力、揭露真相和纠正错误。一旦这些机制遭到破坏,民主制度就很容易滑向独裁。

算法可能产生偏见
人工智能算法的学习依赖于训练数据,而这些数据本身就可能包含人类社会的偏见。

如果用于训练招聘算法的数据集中,男性员工的比例远高于女性员工,那么算法就可能学会偏向男性,在招聘过程中给予男性更高的评分。

算法的学习需要一个明确的目标。然而,目标的设定本身就可能带有主观性和偏见。

另外,算法的决策过程往往缺乏透明度,难以被人类理解和监督,这使得算法的偏见难以被发现和纠正,缺乏自我修正机制。

人工智能伦理难题
康德义务论的核心观点是道德行为应该遵循普遍适用的理性原则,但在实践中却常常遇到困难。

这是因为在现实生活中,人们往往会根据身份认同来区分"自己人"和"外人",并对不同群体区别对待。

假设一台遵守康德"普世规则"、并且想要继续存在的计算机,可能会认为"消灭人类"是一种可以接受的行为。

因为"消灭人类"并不会威胁到作为非生物体的计算机自身的安全,因此这条规则在逻辑上是"普世的"。

计算机不具有生物体对死亡的恐惧,因此它可能无法理解人类对生命的珍视。

即使计算机能够理解和应用康德的义务论,它也可能得出"人类的生命不值得保护"的结论。

所以,依靠抽象的理性原则来构建人工智能伦理框架是远远不够的,需要考虑到人工智能的非生物特性、以及其与人类社会之间复杂的互动关系。

关于功利主义
功利主义认为,能够最大化快乐、最小化痛苦的行为才是道德的行为。

在实际应用中,功利主义面临着如何量化快乐和痛苦的难题。

以“痛苦值”和“快乐值”为例,在复杂的历史情境中,很难准确计算某个行为对世界整体快乐和痛苦总和的影响。

当某个行为带来的痛苦或快乐的结果非常明显时,功利主义可以提供清晰的道德判断。

以纳粹大屠杀为例,大屠杀给犹太人带来了巨大的痛苦,而对其他人(包括德国人)并没有带来相应的利益,因此从功利主义的角度来看,大屠杀是绝对不道德的。

以同性恋为例,对同性恋的迫害给当事人带来了巨大的痛苦,而这种迫害的理由往往是基于偏见和没有实证依据的道德准则,因此从功利主义的角度来看,对同性恋的迫害也是不合理的。

但是,当面对一些难以量化的痛苦或快乐时,例如对死亡的恐惧、对抽象概念的理解等,功利主义难以做出准确的判断。

当不同的道德原则发生冲突时,例如为了保护人权是否可以发动战争,功利主义也难以提供明确的指导。

作者对人工智能时代信息网络的看法
① 信息网络的本质并非在于呈现真相,而是在于联结和维持秩序。

② 从部落社会到现代社会,信息网络的演变伴随着权力的转移。掌握信息网络关键节点的群体或个体将获得更大的权力。

③ 人工智能的出现将催生新的信息网络形态,其影响力远超印刷术或工业革命。

④ 以往的技术革命,例如印刷术革命、工业革命,本质上都是为人类提供了新的工具和手段,而人工智能革命则将非人类智能体(即人工智能)引入信息网络,使其成为主动的参与者和决策者。

⑤ 人工智能是人类历史上第一个能够自行做出决策并产生想法的技术,其潜在风险远超以往任何技术革命。

信息网络史
史前时代 - 公元前1000年:
① 人类生活以小型狩猎采集游群为主,信息网络分布式,口口相传,民主决策。

② 随着农业发展和社会规模扩大,出现中央集权的官僚体系,信息网络从人际网络转变为人与文件互动,信息检索成为难题。

③ 神话故事成为维系社会秩序的重要工具,但也可能掩盖真相。

公元前1000年 - 公元1500年:
① 犹太教利用“书”这项新技术,试图绕过人类中介,直接传播神的旨意,并通过大量复制宗教经典来维护文本权威,限制权力滥用。

② 基督教兴起,教会机构在整理、诠释宗教经典的过程中,获得了巨大的权力。

③  印刷术发明之前,信息传播受限,大规模极权政权难以出现。

公元1500年 - 1900年:

① 印刷术推动信息传播,促进科学革命和启蒙运动,但也为极权主义兴起提供了技术基础。

② 现代官僚制度形成,依赖清单列表和数据管理,与神话故事共同塑造社会秩序。

20世纪:
① 电报、无线电等现代信息技术出现,信息传播速度和范围大幅提升,极权政权得以监控和控制人民生活。

② 冷战时期,民主与极权两种信息网络模式形成鲜明对比。

21世纪:
① 互联网和人工智能兴起,人类进入以算法为基础的新型信息网络。

② 算法在带来便利的同时,也引发了一系列问题,如算法偏见、信息茧房、民主制度受到威胁等。 
 好几个朋友问智人之上这本书如何,刚读到一半,简单说说。

很多人说不如人类简史和未来简史,但我觉得不错,观点新颖,推演也有一定逻辑。

比如用信息网络特征来解读独裁和民主,宗教和AI。

斯大林时期的苏联,中世纪的猎巫行动,这种类荒诞和恐怖,是如何不可避免的发生,未来再次出现的风险。

原本出于流量目的信息传播算法,不自觉的贴合人性,走向宣扬仇恨和民粹,加剧社会的撕裂。

作者担心AI强大后,极权主义可能会上升到新高度,提前敲响警钟。

为了铺垫论证,宗教,政治内容讲的有点多,相比之前的书,读起来有点累。

总之,仍是一本值得读的书,甚至有朋友感慨,这居然能在国内出版?真不容易。 
 2024-09-24 酒后随想

1. 想做一个尝试,申请个X小号,只用英语发内容,回复英文帖子,看是否能突破信息壁垒,快速提升英语阅读水平。

2. 目前AI领域最值得研究的就是如何搭建各种工作流,满足自己日常工作和自媒体发布需求。

3. 最近开始尝试发小红书,后续计划的平台有公众号、视频号、即刻等,如何同步发布内容到多个社交平台,是否有现成的工具,这是否是一个有痛点的需求?

4. 朋友开发的划线笔记更新了随手记功能,最近计划需高频使用,找产品Bug,跟他一起持续迭代。

5. 买了Podwise年费会员,朋友都说我的付费习惯好,其实是为了用钱换时间。虽然免费工具也能搞定,但需要在多个平台切换,还是All-in-one的专业垂直工具省心。

6. 朋友见过很多成功广东老板,问他有什么共性,他的观察是:“胆子大,没想清楚时就敢博;韧性强,能坚持很久;低调,因为赚的赌上身家性命的辛苦钱。” 
 嘉宾Albert部分观点:

AI创业时机:现在是 AI 创业的好时机,比一年前更好。因为现在 AI 领域的发展趋势更加明朗,更容易找到有正反馈的业务。

创业方向:不要盲目追求“大而全”的产品,而是要专注于解决特定用户群体在特定场景下的具体需求。

创业心态:Albert回顾了自己创业心态转变,从早期的“证明自己”到追求“行业影响力”,再到现在的“创造有价值的资产”。

AI创业重点:通过数据提升模型的交付能力,从而改善用户体验。与传统创业模式相比,AI 创业更依赖数据和模型迭代,而非服务、内容或软件功能的堆砌。

如何找PMF:选择“无壁垒”市场,研究成功案例,尤其是分析App Store上后发制人的产品,研究他们做对了什么策略,深入挖掘用户需求。

打造团队:找对新技术充满热情、渴望服务用户、有想法解决用户问题的工程师;以“效果迭代”为核心的团队组织架构,将设计师、算法工程师和领域专家整合在一起。

做正确的事:既能清晰计算概率,又能承担代价的事情。建议创业者避免在无法评估概率或无法承担代价的事情上投入过多精力。

获得好的运气:好运本质上是优势被时间放大的结果,让公司拥有足够长的生存时间,并不断扩大自身优势。所以既要做短期能赚钱的项目养活公司,也要做有长期价值的事。

播客金句:

"创业最好的时间是现在,但更重要的是你的认知水平。"

"创业的目的是创造有价值的资产,而不是讲好一个百亿美金的故事。"

"成功 = 20% 的努力 + 80% 的运气,而好的运气是你的优势被时间放大的结果。"

"选择没有壁垒的市场,从已有的成功案例中学习规律。"

"创业需要平常心,要学会享受过程,接受负反馈。"

"人才和团队是 AI 创业公司最重要的资产,要努力为他们创造价值和安全感。" 
 找 PMF 就是要做没壁垒的事 | 对谈连续创业者 Albert - 42章经

https://t.co/HkeuGsGbez

嘉宾Albert的观点,通过两个维度来判断小公司AI创业机会:做模型擅长、用户有明确交付预期的事。

维度1:能否仅靠模型完成交付
维度2:用户对交付是否有明确预期

NotebookLM提炼观点,POE Claude生成SVG代码(Claude免费额度不够),CleanShot X微调。

另外,推荐SVG代码预览工具 https://t.co/b0nRIuzuqn  不需要登录就能用。 https://pbs.twimg.com/media/GYPmcwPbcAE-riL.jpg 
 不知道你有没有类似需求。
浏览网页时,突然冒出一些想法,需快速记下来。

如果切到笔记软件,有一定操作成本,想法转瞬即逝。

朋友开发的工具,点击Chrome插件图标就能记录想法,不用切换窗口。

https://t.co/800lEXkImv

其他功能:
① 闪卡回顾笔记
② AI搜索笔记。
③ AI打标
④ 导出Markdown https://pbs.twimg.com/media/GYOHR5VakAAoq1p.jpg https://pbs.twimg.com/media/GYOHiTcakAATmBs.jpg https://pbs.twimg.com/media/GYOHuPZaUAEdpK2.jpg https://pbs.twimg.com/media/GYOIUyuagAA3sPV.jpg 
 英语名言海报Coze机器人:https://t.co/Fo5OfReEO5

工作流搭建简化教程:https://t.co/aZgR7UiX9F 
 今天开始研究Coze,搭建了个工作流:英文quote自动翻译合成海报,加上中英文朗读。

把这些素材导入剪映,生成每日英语打卡视频。

好评:
小白用户,拖拽连线就能做实用的工作流。

差评:
1. Coze的画板交互设计有点差,拖拽不好用,删除元素后,竟然不能再次添加,只能重新写变量。

2. 插件库第三方个人上传的很多不能用,也没调用说明。

3. 交互设计不符合直觉,拆成工作流和图片流等,概念多,小白用户很难理解如何用。 https://video.twimg.com/ext_tw_video/1838247145868292096/pu/vid/avc1/480x854/p94mrxXoJfHvU-52.mp4?tag=12 
 1923年,捷克作家卡雷尔·恰佩克创作的戏剧《罗素姆万能机器人》在伦敦上演,世界上第一次诞生“机器人”这个名词。 https://t.co/7LNZWbgn73 https://pbs.twimg.com/media/GYFxCFeb0AUJV5L.jpg 
 旧Macbook重装系统,为快速让电脑达到顺手状态,安装配置了不少软件,记录如下:

输入法:装了搜狗和微信,核心主力是搜狗,虽然有隐私风险。

浏览器:必须还是Chrome,云同步太棒,暂时先不装ARC。

社交聊天:微信Mac客户端,飞书,Telegram。

快捷启动:用Raycast替换系统Spotlight,且买了 AI 功能。

RSS阅读器:Follow,目前最火的RSS工具 https://t.co/ARl0nTJ2WU

翻译工具:Bob,配置火山翻译和DeepL。

魔法上网:Intel芯片不能用小火箭,免费客户端叫Karing,虽然丑,但能用。

电子书下载:Z-library客户端 https://t.co/tIc0tunKrm

闪卡工具:Anki  https://t.co/vJhE3gaP05

笔记工具:Heptabase,Notion。

终端:Warp,高颜值且有AI辅助  https://t.co/FQhk5Oiyam

编程IDE:Cursor、Sublime Text。

软件管理器:淘宝买了Setapp一年订阅,自带大量优秀App,后面装的软件都来自这里。

视频下载工具:Downie和其Chrome插件,顺带装了Permute,用于视频格式转换。

截图工具:CleanShot X,替换系统截图快捷键,修改为默认打开编辑器和复制剪贴板。

系统管理:Setapp公司开发的CleanMyMac X,用于卸载软件,清理文件和安全防护。

视频格式转换:Permute,支持格式挺全。

AI套壳:装Quora的POE,20美元/月,主流LLM全部支持。

文件拖拽:还是Dropzone顺手,Dropover还需要摇几下。 
 再次推荐 Warp 这个颜值颇高的 AI 终端软件,用自然语言执行各种终端命令,小白福音。

进入AI agent模式,只需要按快捷键 CMD + I。

https://t.co/Dw40JtAnNh https://t.co/Bz2Eb6OahU https://pbs.twimg.com/media/GYA1Ne_b0AA24JV.jpg 
 买了个LG的27寸显示器,27up850n,初步使用体验还不错。 https://t.co/hIU10j1wrv https://pbs.twimg.com/media/GX5W4I5bEAAU4QG.jpg 
 Scaling Law 遇到瓶颈,Self-Play RL可能是新的通往AGI的靠谱路径。

张小珺Jùn访谈前OpenAI 研究员,讨论OpenAI o1和self-play RL

https://t.co/EjYwB3JuPX

1. Scaling Law 可能遇到瓶颈,有三个问题

① 参数:现有模型参数规模难以突破,且收益递减。

② 数据:获取高质量文本数据的难度越来越大。

③ 算力:现有 GPU 集群规模难以大幅提升,且运维成本高昂。

例如:英伟达B100 GPU 尚未问世,短期内算力瓶颈。

马斯克 XAI 的十万卡集群策略或许能带来突破,但是超大规模集群运维和训练难度极高,挑战巨大。

2. 如何突破Scaling Law的瓶颈?

三条潜在路线:多模态、十万卡集群、强化学习。

多模态:引入视觉等多模态数据,但目前缺乏证据表明其能带来智能水平的提升。

十万卡集群:通过更大规模的算力集群来突破瓶颈,但技术难度和运维成本巨大。

强化学习(RL):被认为是最具潜力、最接近人类学习方式的方法,可能成为新的 Scaling Law。

3. 什么是强化学习?

让 AI 通过随机路径尝试新任务,并根据奖励反馈机制更新神经网络权重,从而学习如何完成任务。

LLM侧重于利用现有数据,而强化学习更强调 AI 的自主探索和决策能力,更接近人类的学习方式。

Self-Play RL、传统 RL 和 RLHF 的区别

自博弈强化学习 (self-play RL) 是强化学习的一种特殊形式,指的是 AI 与自身的不同版本进行对抗训练,从而不断提升自身的能力。

这种方法在游戏领域,如 AlphaGo 和 AlphaStar 中取得了巨大的成功,展现出了超越人类的智能水平。

RLHF 的主要目的是让人工智能模型的行为更符合人类的偏好,而不是追求超越人类的超级智能。

与 Self-Play RL 相比,RLHF 更侧重于人机对齐,而不是提升模型的逻辑推理能力。

Self-Play RL 与传统的 RL 的主要区别在于智能体的计算量大幅增加,例如 AlphaZero 与今天的大语言模型相比,参数量相差了三到四个数量级。

4. 点评AI赛道:代码、视频、机器人

代码生成:AI 编程工具的兴起,如 Cursor。大众消费级编程工具的巨大潜力。Coding 成为 RL 新范式下最匹配的应用方向。

视频生成:SORA 推动了视频生成技术的进步。DIT 路线潜力巨大。人人都是导演的时代即将到来。但视频生成领域的格局尚未稳定,存在巨大风险和机遇。

通用机器人:OpenAI 引爆了通用机器人赛道。目前仍处于早期阶段,技术突破是关键。商业化落地尚需时日,投资风险较大。

5. 点评硅谷主要玩家

OpenAI:商业化进程缓慢,产品策略有待改进。人才流动频繁,但核心团队稳定,影响有限。

Anthropic:Claude 3.5 表现亮眼,强化学习路线领先。创始团队技术实力雄厚,未来发展值得期待。

其他公司:Google、Tesla 在机器人领域具有优势,值得长期关注。Apple 作为硬件巨头,将从 AI 浪潮中持续受益。 
 因为喝酒闹过很多笑话。

十多年前一次,喝多后酒店不收,大学同学辗转找到家人联系方式,驱车送我回去,路上吐了好几回。那时租房,6楼没电梯,据说两个人抬上楼,把他们累的半死。

再往前是在学校喝多,连着睡了快两天,时不时有同学探望,甚至摸我脉搏😂。醒来第一件事让同学买了一瓶可乐和一根糖葫芦,喝完吃完才缓过来劲儿。

以致每次大学好友聚会,大家都会回忆这些片段,大家笑的前仰后合。

年少时轻狂,喝酒不管不顾,碰杯就干。
现在步入中年,再也没有当年的豪气,喝醉的机会也越来越少。

但回忆当年的傻事,依然动容,这可能就是青春。 
 把这篇文章用NotebookLM变成了播客节目,对话超自然,相当惊艳!
https://t.co/MkjfFFVce3

多模态素材互相转换是一个挺明显的趋势:

文本<->播客
文本<->视频 https://t.co/1HENkj7e8B https://pbs.twimg.com/media/GXeUJA3bwAAlpS2.jpg https://video.twimg.com/ext_tw_video/1835097960172179456/pu/vid/avc1/854x480/suHulr14wSGJ8Xav.mp4?tag=12 
 Remnote这个闪卡制作工具有趣。

先写概念,然后按2次“=”号,自动出现AI补全。
按下Tab后就能做一张闪卡。

https://t.co/N67s6Rumhi https://t.co/w5KzHnSFfy https://pbs.twimg.com/media/GXcN4rIbwAUiKQd.jpg 
 《如何快速学习:掌握任何技能的 10 种有效方法》
虽然很标题党,但内容有科学共识

https://t.co/oKrRQBEXQm

阅读总结补充发挥下

充足睡眠最重要

① 睡眠将短期记忆转化为长期记忆。在慢波睡眠或非快速眼动睡眠周期中,大脑会将白天的信息整理存储。

② 睡眠有助于帮大脑发现新信息和已有想法的关联和模式,提升创造性。

③ 信息过载时,小憩或睡眠能恢复精力,重置接收新信息的能力。

如何改善睡眠

① 建立规律作息时间,形成生物钟。

② 睡前避免过度刺激(激烈运动,刺激音乐,油腻食物,兴奋读物或紧张电视节目)

③ 卧室装遮光窗帘,尽量减少光线,手机放卧室外。

提高专注力

① 番茄工作法:25分钟集中学习,5分钟休息(冥想、伸展运动等,不要看手机)

② 五分钟法则:拖延时,欺骗自己只做5分钟,做着做着就会进状态。

③ 优化学习环境:将学习空间和放松空间分开,建立学习前仪式。(整理书桌/电脑,手机放另外房间等)

有效学习方法

① 主动练习: 做与你想要掌握的技能相关的事情来积极练习。比如看Youtube学编程来顺便学英语。

② 主动回忆: 通过测试回忆新学习的知识(通过闪卡类工具)

③ 间隔重复: 分散学习时间,不要集中冲刺,改善长期记忆力。或其他工具来帮助你进行间隔重复。

④ 组块化: 将零散的信息组成有意义的大单元。(缩写、记忆宫殿法等)

学习技巧

① 费曼技巧:用简单的语言向别人解释你学到的知识。(假设你的听众是5岁小孩)

② 刻意练习:将复杂任务分解成更小的部分。比如练吉他,分成小节练等。

学习辅助工具/方法:

① 间隔重复:抽认卡 Anki、闪卡笔记 RemNote、Notion建模版等。

② 番茄钟:个人推荐Setapp里的Session,设计美观。也有很多免费软件。

③ 组块记忆:记忆宫殿法等。https://t.co/67mPxXKYfO

④ 学习仪式:朋友喜欢用打字进入心流状态,再开始学习。 https://t.co/Tf6u5I8yFx https://pbs.twimg.com/media/GXcLtOzbUAAjUv4.jpg https://pbs.twimg.com/media/GXcL3fTbgAAq1o5.jpg https://pbs.twimg.com/media/GXcMCC7bwAMgxYl.jpg https://pbs.twimg.com/media/GXcMCC8a4AAPWZi.jpg 
 优秀优秀! 
 2007年注册Twitter,当时听到宣传是“公民新闻平台”,自由平等,人人可以发布新闻消息。

频繁开始用,始于2022年11月ChatGPT推出后,为了看第一手AI资讯。 
 正愁不知道中秋节去哪里玩,突然发现家附近有音乐节。打算9月16日看看杭盖乐队,有好多年没看他们现场演出了。

没听过李宇春的歌,但当年也是传奇,靠手机短信投票选出来的冠军,可能是国人离民主机制最近的一回?

海报识别二维码购买半价,买最便宜票99块。 https://t.co/i4TnLLuc9z https://pbs.twimg.com/media/GXb1T4zbwAEFBPH.jpg 
 北京,阴沉沉的天,好像要下雨,驱车20分钟来到北七家未来科学城,旁边立着一座很有现代艺术风格的桥,能听到桥下潺潺的流水声。

急流与缓流的交接处,就是最佳的路亚标点。

背上蓝色的单肩路亚包,从车上拿出木柄+紫色塑料环的伸缩路亚竿,扶着河堤旁的树,小心翼翼走下石头斜坡。

水不多,河底石块露出水面,能看到小鱼游动带来的水波,时不时有鱼跳出水面,好兆头。

包里取出路亚盒,拿出一个模拟黑白腹蚊的钩子,绑上80厘米长鱼线,根据去年经验,这对白条、马口有奇效。

奋力抛出第一杆,水滴轮和线摩擦的声音很悦耳,浮水助投器先接触水面,落点在15米左右,开始收线,可惜什么也没有...

接着抛出第二杆、第三杆...

过了15分钟,一无所获,心里开始有点烦躁,眉头紧锁,心想今天难不成要空军。

转机来了,收线快到脚边时,出现轻微电击的触感,杆子一阵抖动,鱼咬钩了,快速收线把鱼拽出水面,一条瘦小的白条,摘掉放生。

目光投向远处湍急的水流,后面有一片缓流区,这种地方最藏鱼。

调低水滴轮档位,为了出线更丝滑,抛的更远。刚落到水面,duang!鱼又咬钩了,且力道不小。拖出水面才看清楚,一条相当肥的马口鱼,赶紧掏出手机拍照留念。 
 奥威尔的六条写作规则:

1. 永远不要使用你习惯在印刷品中看到的隐喻、比喻或其他修辞手法。

2. 不要在可以用短词表达的地方使用长词。

3. 如果可以删去一个词,就一定要删去它。

4. 在可以使用主动语态的地方,绝不要使用被动语态。

5. 如果你能想到一个日常的等价词,就不要使用外语短语、科学词汇或行话。

6. 比起直接说出任何野蛮的事情,打破这些规则更为重要。 https://pbs.twimg.com/media/GXWExm6XkAA6Fx1.jpg 
 社会心理学家乔纳森·海特(Jonathan Haidt)说:"人类的思维是一个故事处理器,而不是逻辑处理器。每个人都喜欢一个好故事;每个文化都在故事中浸润着他们的孩子。"

故事能触发大脑释放三种主要的神经化学物质:多巴胺、催产素和内啡肽:

1. 通过制造悬念和期待来释放多巴胺,多巴胺能提高注意力、动力和记忆力。
2. 通过讲述情感故事来释放催产素,催产素能增强同理心、信任感和慷慨行为。
3. 通过幽默或触动人心的内容来释放内啡肽。内啡肽能减轻痛苦,增加幸福感。

但是,故事也有弊端,容易产生叙事谬误,就是把没有实际联系的事情之间想象出因果关系。

例如
"狗在联合收割机下睡觉。农民转动钥匙。"

看到这两句无关的描述,而我们的大脑会自动编织出一个潜在的悲剧故事。

想讲好故事,要有意识建立自己的故事库。

比如从个人经历、身边的人和各种渠道收集故事,通过记忆和练习,随时在需要时讲出一个合适的故事。

方法很简单,试着每天花五分钟回顾一天,找出最值得讲述的时刻。

原文:https://t.co/7miXBZLbY5 
 仅需一个URL就能生成广告宣传视频?完全没问题!

Adsdog是一个专门用于生成高质量营销视频的AI工具。
只需提供产品链接或上传相关描述和图片,即可自动生成吸引人的营销视频。

提供URL后,工具自动抓取详情页中的文本、图片、视频信息,按选定目标人群和语种生成 AI 口播,再用Avatar数字人生成宣传视频,整个操作只需要 1-2 分钟。

支持亚马逊、TikTok、Shopify、Ebay、App store、安卓应用商店、Temu、Shein等大量平台。

还支持各种细节微调,比如要不要加字幕,哪些文案要高亮,用什么配乐,选什么数字人等,这让视频看起来比较Native 原生。

强烈推荐做出海电商的朋友试试:
https://t.co/8pJj0E11s4 https://video.twimg.com/ext_tw_video/1834437537810841601/pu/vid/avc1/720x1280/dG0_MxazCT2S90yu.mp4?tag=12 
 快速找到并下载优秀电子书,双语翻译对照阅读。

1. 找到你感兴趣的人,看他推荐过的书   https://t.co/FKcOldaI9G

2. 截图书籍封面和名称,提问Gemini,让给出介绍和评分。https://t.co/H2o84neGlg

3. 用 Z-Library 下载电子书 https://t.co/N3Vc88IQcC

4. 传到微信读书,变成双语版阅读 https://pbs.twimg.com/media/GXQh2DCbgAEPGV_.jpg https://pbs.twimg.com/media/GXQh-EHbgAIXtm_.jpg https://pbs.twimg.com/media/GXQiEbCbgAE_SmZ.jpg https://pbs.twimg.com/media/GXQiwGyaEAALq_Z.jpg 
 几个产品点子,哪个靠谱?

1. 第二大脑:Readbility+https://t.co/YDXkTcL9Mo search

2. 鸡汤视频:文生图 + TTS + PPT模版,生成短视频多平台发布

3. 英语学习:视频片段+ 影子跟读 + 背诵朗读打卡,分享社交媒体。

4. 达人工具:广告/UGC视频拆解 + AI市场调研 + AI仿写脚本,广告主反馈定稿。 
 去年写的教程,从注册域名到搭建Wordpress博客全纪录。

没想到今天帮到了自己,多写多记录,没坏处。

https://t.co/Wr14yjk2L6 
 这个教程看起来简单,但我没成功,重启还是原来的系统。 
 感谢🙏🏻 看看复杂度,放弃了,转需。 
 测试案例

原文:https://t.co/aQXhtAJGmd

创业公司为什么有机会赢大公司?用费曼学习法解释:

大象虽然强壮, 但动作慢, 而小老鼠灵活快速。

在商业世界里, 大公司就像大象, 小公司就像小老鼠。

大公司有很多钱和资源, 但他们常常被自己的规模和规则束缚住了。

比如,他们做事情要经过很多人同意, 就像一个大家庭要决定去哪里度假, 每个人都要同意, 最后可能什么也决定不了。

小公司虽然资源少, 但他们可以快速行动。他们可以尝试新鲜有趣的点子, 就像你可以很快决定今天想吃什么零食。

他们也可以为每个客户提供特别的服务,就像你给好朋友准备生日礼物一样用心。

小公司还可以专注于大公司不太关注的小市场。

想象一下, 如果有一种特别的糖果, 只有你们学校的学生喜欢吃。

大公司可能不会为这么小的市场生产糖果,但小公司可以专门为你们做这种糖果。

虽然小公司看起来不如大公司强大, 但只要他们聪明地利用自己的优势, 专注于大公司做不到或不愿意做的事情, 他们就能在竞争中取胜。

就像小老鼠可以在大象注意不到的地方找到食物和藏身之处一样。 
 花一个小时,在AI帮助下,为Raycast AI写了一个文章总结Prompt,模型用sonnet3.5,平衡速度和质量,输出结果很超预期,既有概括也有细节,关键句子加粗,快速获取关键信息,有点满意😄。

效果:按快捷键自动总结当前浏览网页。

另外,根据自己需求,刻意加了“费曼学习法”和“信息可视化”、“延展阅读”模块。

1. 类比解释,让文章傻瓜化易懂。
2. AI设计信息提炼呈现,丢给Claude可生成图。
3. AI推荐相关书籍或播客。

测试文章:https://t.co/tVUWcsBxgz

Prompt如下:
请用中文详尽总结指定的内容。这是一项重要任务,可能影响重大决策。请按照以下步骤逐一执行,确保每步都得到充分完成。每步结果请单独呈现:

1. **背景分析**(使用Markdown引用格式 > 呈现):
   > a. **主题识别与完善**:
   >    - 列出文章的主要主题
   >    - 识别潜在的次要主题
   >    - 指出可能被忽视但相关的主题
   > 
   > b. **多角度分析**:
   >    - 从科学、社会、经济、伦理、技术、环境等角度分析每个主题
   >    - 说明每个角度带来的独特见解
   >    - 分析这些角度如何相互关联

2. **结构化总结**(核心步骤):
   目标:创建一个逻辑清晰、内容丰富的总结。
   - 使用二级标题(##)为每个主题创建独立章节,标题加粗
   - 每章节用1-2个段落详细阐述,确保深度和连贯性
   - 加粗关键句子或核心观点
   - 使用清晰、专业的语言,如高质量科普文章
   - 引用原文中的完整案例或故事,保留关键细节
   - 人名可中英并列,确保称呼和介绍完整
   - 使用适当的Markdown层级结构
   - 以第一人称表达,如"通过阅读这篇文章,我们可以看出...",保持谦虚和谨慎

3. **核心要点与关键洞见**:
   目标:提炼文章的精华。
   - 列出3-5个最重要的观点或结论,直接基于原文
   - 提供1个独特的、有深度的洞见,新颖但紧密关联原文
   示例:
   - 核心观点1:[简明扼要的陈述]
   - 独特洞见:[新颖视角,并解释其与原文的关联]

4. **费曼学习法解析**:
   目标:用简单语言解释复杂概念。
   - 假设你在向一个12岁的孩子解释文章的核心内容
   - 使用简单的类比和日常生活例子
   - 避免专业术语,focus on the big picture

5. **深入学习资源**:
   目标:提供扩展阅读建议。
   - 推荐2-3个高质量、多样化的额外资源
   - 简要说明每个资源的价值和独特之处
   示例:
   1. [资源名称]:[简短说明其如何补充或扩展本文主题]

6. **信息可视化建议**:
   目标:提供数据或概念的可视化方案。
   - 建议1-2种适合的图表或图形类型
   - 描述关键元素和布局
   - 如适用,提供一个创新的类比或比喻

请基于以上步骤,对以下内容进行全面、深入、有洞见的总结。记住,始终紧扣原文内容,避免过度发散:

{browser-tab} https://pbs.twimg.com/media/GWzfgM8aMAEKuRv.jpg https://pbs.twimg.com/media/GWzh0pyXQAAwhna.jpg https://pbs.twimg.com/media/GWzi-5YagAAy42A.jpg https://pbs.twimg.com/media/GWzjO20bwAAC9rj.jpg 
 国内主流云平台都超难用!
各种看不懂的名词,各种易点错的菜单,搜索也不好用。
想租个GPU服务器玩ComfyUI,半天都没搞定。

最后选了AutoDL,社区镜像真方便,开箱即用。

AutoDL ComfyUI 租用和配置教程:https://t.co/iqTsXVeO5r

另外,强烈Youtube氪学家出品的ComfyUI教程,清晰易懂,一学就会。(但不要参考他的腾讯云安装,坑很多)

https://t.co/jCVqmbXR1d https://pbs.twimg.com/media/GWuQzKEWIAA52A_.jpg 
 MyShell是一个相当不错的AI创业团队的,目前正在招远程工作者,岗位要求:

- 至少熟练一款Agent 工作流工具,如 ComfyUI,WebUI, Coze, Dify等
持续GTM能力。
- TOP本科及以上学历,计算机相关专业。
- 英语可作为工作语言。
- 远程工作岗位。
- 简历投递:rick@myshell.ai

如果不会Agent工作流,也建议赶紧学起来,很有前途! https://pbs.twimg.com/media/GWspk7PXoAA-R6Z.jpg 
 混合多种运镜,配上污秽摇篮的歌曲,做一个死亡金属MV。😏

Prompt如下:
1. 用Dolly Shot技巧拍摄一个会跳舞的风暴骷髅💀兵

2. 用Dutch Angle技巧拍摄一个会跳舞的风暴骷髅💀兵

3. 交替使用Close-up Shot、Whip Pan、Time-lapse Shot、Slow Motion Shot技巧拍摄一个会跳舞的风暴骷髅💀兵

4. 类似暗黑破坏神的场景氛围中,先用Long Shot镜头,再用Whip Pan镜头,拍摄一群在跳舞的风暴骷髅💀兵,最后用close-up镜头拍其中一个邪恶大笑的骷髅💀兵。 https://video.twimg.com/ext_tw_video/1830990746226171904/pu/vid/avc1/1280x720/0p_BV2ovnybcGpCC.mp4?tag=12 
 最近文生视频模型越来越多,比如海螺视频、可灵、luma、runway等等。

可是,我们大多数人都不是影视工作者,如何写好文生视频Prompt呢?

初步摸索发现两个技巧:

1. 用文本模型优化Prompt,提供大量细节描述。可以用Claude sonnet或GPT4o。

2. 研究影视工作者的运镜技巧,比如让AI给的20种常见shot类型和方法。

Tracking Shot: 跟踪拍摄,摄像机跟随主体移动。

Dolly Shot: 推轨拍摄,摄像机在轨道上平滑移动。

Crane Shot: 摇臂拍摄,使用摇臂实现垂直和水平移动。

Steadicam Shot: 稳定器拍摄,使用特殊设备实现流畅移动。 

Pan Shot: 平移拍摄,摄像机水平旋转。

Tilt Shot: 俯仰拍摄,摄像机垂直旋转。 

Zoom Shot: 变焦拍摄,通过镜头调整焦距。 

Static Shot: 静态拍摄,摄像机固定不动。 

Handheld Shot: 手持拍摄,带来更自然或紧张的感觉。 

Dutch Angle: 倾斜角度,故意倾斜摄像机创造不安或戏剧性效果。 

Over-the-Shoulder Shot: 肩膀视角,通常用于对话场景。 

Point-of-View (POV) Shot: 主观视角,模拟角色的视线。 

Aerial Shot: 航拍,通常使用无人机或直升机。

Establishing Shot: 场景介绍镜头,通常是广角拍摄。

Close-up Shot: 特写镜头,聚焦于细节。 

Long Shot: 远景镜头,展示整个场景。 

Two Shot: 双人镜头,同时拍摄两个人物。

Whip Pan: 快速平移,快速转向创造动感或过渡效果。 

Time-lapse Shot: 延时摄影,压缩长时间事件。

Slow Motion Shot: 慢动作拍摄,放慢动作展示细节。

甚至可以把运镜方法告诉文本AI,让它给出合适的拍摄技巧。

一个生成示例:

Create a visually stunning and dynamic video showcasing a premium sneaker, utilizing a combination of popular cinematography techniques:

1. Begin with an Establishing Shot of a sleek, minimalist studio setup.

2. Transition to a series of Close-up Shots, highlighting the sneaker's unique textures and design details.

3. Employ a Dolly Shot, smoothly moving around the shoe to reveal its profile.

4. Utilize a Macro Shot to zoom in on intricate stitching or material transitions.

5. Incorporate a Tracking Shot following a drop of water as it beads off the shoe's water-resistant surface.

用海螺视频生成效果如下
https://t.co/RV9gqDw3A2 https://video.twimg.com/ext_tw_video/1830967718553755651/pu/vid/avc1/1280x720/8bWI93-lYUsjK9g-.mp4?tag=12 
 真的不错,无论是产品想法还是交互体验。
简单用几下就发现是用心设计的,有独特想法的工具。 
 https://t.co/pjiepiGrEc 记得之前是个跟Midjourney类似的AI图片生成网站。

现在好像改版了,用模版+AI对话修改的方式二次创作。

实现快速制作Logo、海报、产品原型、T恤、Memes、纹理图...  非常实用接地气。

简单测试了基于模版AI生成Logo,效果不赖!

可理解为Canva的AI native版,有前途~ https://t.co/rwJcc13n43 https://pbs.twimg.com/media/GWZOHmia0AAyuyB.jpg https://pbs.twimg.com/media/GWZOgyPawAAf_JK.jpg https://pbs.twimg.com/media/GWZOz3UacAA8atF.jpg https://pbs.twimg.com/media/GWZPOKlWEAM6wcf.jpg 
 李沐估计没少看玄幻小说,这个对大语言模型原理的解释类比太好玩了。

“我说机器学习像是老中医,深度学习可能跟玄幻小说的炼丹有点像。

所以你看现在的语言模型就很像炼丹,你要把一些材料放进一个丹炉里面,然后有个丹方去把它炼出来。

那么数据就是你要找的材料。

你看那些小说里面,主角大部分时间都在找材料,包括去深山里面找、去拍卖会上买,所以搞数据是很难的事情,是个体力活。

但是你必须得有这些数据,而且要多弄一些,因为你不知道到时候会不会毁掉一些。

算力也很重要,就是说火要大一点,设备要先进一点,因为越好的设备炼出来的东西越好。

算法就是你的丹方了。
丹方这个东西可能跟小说不一样。
它每年都在进步,而且对于细节的把控非常重要。

就算别人告诉过你这个东西怎么弄,但在真实的场景里面,你会发现还是挺不一样的。

这就有点像你去徒手发射火箭,发之前你要动手调一调,没调好的话就炸掉了。”

原文地址:https://t.co/YCdpN0hYv1 
 常在河边走哪有不湿鞋,因为今年开车自驾出行多,去山东泰安时不小心闯红灯扣6分,河南回京途中走应急车道扣3分。

昨天去天津西站接人,不小心逆行,感觉大概率会被拍,马上要扣满12分。

研究发现,通过交管12123 App在线学习减分,最多可以减6分。

流程:先打开App申请“学法减分”(申请后延迟几分钟通过),看30分钟教育视频(每5分钟记一次,有人脸识别检测),获得两次在线考试机会,20道题答对18道以上,系统核验通过后扣减1分。

找题库时发现iOS和微信小程序有各种“学法减分”拍照搜题工具…

甚至还有App打广告推广,按次或按天付费,18元30次等等。

不由赞叹,这需求点抓的真好… 
 Lex Fridman的播客经常会采访一些大牛,搜到个Kaggle上的数据集,有300多期访谈CSV文件。
https://t.co/sHNLx6neMx

下载后让Claude写个Python程序生成300个txt文件,传到notebookLM使用。

生成文件Python代码:

import csv
import os
import sys

# 增加CSV字段大小限制
csv.field_size_limit(sys.maxsize)

def create_txt_files_from_csv(csv_file_path):
    # 确保输出目录存在
    output_dir = 'output_txt_files'
    os.makedirs(output_dir, exist_ok=True)
    
    # 读取CSV文件
    with open(csv_file_path, 'r', newline='', encoding='utf-8') as csvfile:
        csv_reader = csv.DictReader(csvfile)
        
        # 遍历CSV的每一行
        for row in csv_reader:
            # 获取title和text
            title = row['title']
            text = row['text']
            
            # 创建安全的文件名(移除不允许的字符)
            safe_title = "".join([c for c in title if c.isalpha() or c.isdigit() or c==' ']).rstrip()
            
            # 如果文件名为空,使用id作为文件名
            if not safe_title:
                safe_title = f"file_{row['id']}"
            
            # 创建文件路径
            file_path = os.path.join(output_dir, f"{safe_title}.txt")
            
            # 写入文本文件
            with open(file_path, 'w', encoding='utf-8') as txtfile:
                txtfile.write(text)
            
            print(f"Created file: {file_path}")

# 使用函数
csv_file_path = 'podcastdata_dataset.csv'  # 替换为你的CSV文件路径
create_txt_files_from_csv(csv_file_path) https://pbs.twimg.com/media/GWG4KwPbsAA-Df4.jpg https://pbs.twimg.com/media/GWG4YyvasAAUD8N.jpg https://pbs.twimg.com/media/GWG4eS2bMAAcqE-.jpg