最近一期的a16z Podcast,探讨了人工智能 (AI) 语音技术最新进展及其对不同领域的影响,摘录一些观点
① 实时性是语音交互的关键,低延迟 (低于 300-400 毫秒) 才能创造与真人对话的错觉。
② 电话是与世界互动的 "API",实时语音技术将使更多人通过电话体验 AI
③ 语音是人类最古老、最自然的交流方式,但一直未成为与技术交互的主要界面。AI 正在改变这一现状,语音识别和处理技术的进步使 "语音编程" 成为可能。例如AI语音代理可以替代人工进行电话客服、预约等工作,还有AI语音伴侣和语言学习等应用也展现出巨大潜力。
国庆假期到了,朋友们推荐了一些书,打算抽空翻翻:
①《大脑传》-马修·科布
② 《毛泽东传》-迪克·威尔逊
③《棋与人生》-加里·卡斯帕罗夫
④ 《给青年的十二封信》-朱光潜
⑤ 《真希望我父母读过这本书》-菲利帕·佩里
又重温了纳瓦尔关于读书的看法:
① 养成每天阅读的习惯,每天坚持比一次性大量阅读更重要。
② 选择你感兴趣的书,兴趣是最好的老师,不要执着于读好书,垃圾读物也能帮你找到真正感兴趣的领域。
③ 不要害怕阅读非主流书籍,即使不同意作者观点,也有助于帮你全面理解世界。
④ 与其读所有书,不如反复阅读一百本好书。
⑤ 阅读要和写作结合,把阅读收获提炼成简单的几句话,发到社交媒体跟人交流。
《如何快速学习:掌握任何技能的 10 种有效方法》
虽然很标题党,但内容有科学共识
https://t.co/oKrRQBEXQm
阅读总结补充发挥下
充足睡眠最重要
① 睡眠将短期记忆转化为长期记忆。在慢波睡眠或非快速眼动睡眠周期中,大脑会将白天的信息整理存储。
② 睡眠有助于帮大脑发现新信息和已有想法的关联和模式,提升创造性。
③ 信息过载时,小憩或睡眠能恢复精力,重置接收新信息的能力。
如何改善睡眠
① 建立规律作息时间,形成生物钟。
② 睡前避免过度刺激(激烈运动,刺激音乐,油腻食物,兴奋读物或紧张电视节目)
③ 卧室装遮光窗帘,尽量减少光线,手机放卧室外。
提高专注力
① 番茄工作法:25分钟集中学习,5分钟休息(冥想、伸展运动等,不要看手机)
② 五分钟法则:拖延时,欺骗自己只做5分钟,做着做着就会进状态。
③ 优化学习环境:将学习空间和放松空间分开,建立学习前仪式。(整理书桌/电脑,手机放另外房间等)
有效学习方法
① 主动练习: 做与你想要掌握的技能相关的事情来积极练习。比如看Youtube学编程来顺便学英语。
② 主动回忆: 通过测试回忆新学习的知识(通过闪卡类工具)
③ 间隔重复: 分散学习时间,不要集中冲刺,改善长期记忆力。或其他工具来帮助你进行间隔重复。
④ 组块化: 将零散的信息组成有意义的大单元。(缩写、记忆宫殿法等)
学习技巧
① 费曼技巧:用简单的语言向别人解释你学到的知识。(假设你的听众是5岁小孩)
② 刻意练习:将复杂任务分解成更小的部分。比如练吉他,分成小节练等。
学习辅助工具/方法:
① 间隔重复:抽认卡 Anki、闪卡笔记 RemNote、Notion建模版等。
② 番茄钟:个人推荐Setapp里的Session,设计美观。也有很多免费软件。
③ 组块记忆:记忆宫殿法等。https://t.co/67mPxXKYfO
④ 学习仪式:朋友喜欢用打字进入心流状态,再开始学习。 https://t.co/Tf6u5I8yFxhttps://pbs.twimg.com/media/GXcLtOzbUAAjUv4.jpghttps://pbs.twimg.com/media/GXcL3fTbgAAq1o5.jpghttps://pbs.twimg.com/media/GXcMCC7bwAMgxYl.jpghttps://pbs.twimg.com/media/GXcMCC8a4AAPWZi.jpg
最近文生视频模型越来越多,比如海螺视频、可灵、luma、runway等等。
可是,我们大多数人都不是影视工作者,如何写好文生视频Prompt呢?
初步摸索发现两个技巧:
1. 用文本模型优化Prompt,提供大量细节描述。可以用Claude sonnet或GPT4o。
2. 研究影视工作者的运镜技巧,比如让AI给的20种常见shot类型和方法。
Tracking Shot: 跟踪拍摄,摄像机跟随主体移动。
Dolly Shot: 推轨拍摄,摄像机在轨道上平滑移动。
Crane Shot: 摇臂拍摄,使用摇臂实现垂直和水平移动。
Steadicam Shot: 稳定器拍摄,使用特殊设备实现流畅移动。
Pan Shot: 平移拍摄,摄像机水平旋转。
Tilt Shot: 俯仰拍摄,摄像机垂直旋转。
Zoom Shot: 变焦拍摄,通过镜头调整焦距。
Static Shot: 静态拍摄,摄像机固定不动。
Handheld Shot: 手持拍摄,带来更自然或紧张的感觉。
Dutch Angle: 倾斜角度,故意倾斜摄像机创造不安或戏剧性效果。
Over-the-Shoulder Shot: 肩膀视角,通常用于对话场景。
Point-of-View (POV) Shot: 主观视角,模拟角色的视线。
Aerial Shot: 航拍,通常使用无人机或直升机。
Establishing Shot: 场景介绍镜头,通常是广角拍摄。
Close-up Shot: 特写镜头,聚焦于细节。
Long Shot: 远景镜头,展示整个场景。
Two Shot: 双人镜头,同时拍摄两个人物。
Whip Pan: 快速平移,快速转向创造动感或过渡效果。
Time-lapse Shot: 延时摄影,压缩长时间事件。
Slow Motion Shot: 慢动作拍摄,放慢动作展示细节。
甚至可以把运镜方法告诉文本AI,让它给出合适的拍摄技巧。
一个生成示例:
Create a visually stunning and dynamic video showcasing a premium sneaker, utilizing a combination of popular cinematography techniques:
1. Begin with an Establishing Shot of a sleek, minimalist studio setup.
2. Transition to a series of Close-up Shots, highlighting the sneaker's unique textures and design details.
3. Employ a Dolly Shot, smoothly moving around the shoe to reveal its profile.
4. Utilize a Macro Shot to zoom in on intricate stitching or material transitions.
5. Incorporate a Tracking Shot following a drop of water as it beads off the shoe's water-resistant surface.
用海螺视频生成效果如下
https://t.co/RV9gqDw3A2https://video.twimg.com/ext_tw_video/1830967718553755651/pu/vid/avc1/1280x720/8bWI93-lYUsjK9g-.mp4?tag=12
Notes by 向阳乔木 | export