Oddbean new post about | logout
 一款很好用的浏览器抓取插件  Easy Scraper - One-click web scraper

https://t.co/n2tDc5sHhn

抓取网页,一般从获取URL列表开始,然后抓取详情页。

比如我想读英语故事学英语,想采集100wordstory网站内容导入到Heptabase,每天学一篇。

1. 打开 https://t.co/1YXBoYGtHL 点击插件图标,它会自动提取页面中URL,支持下载为CSV或JSON。

2. 切换为“抓取详情页”,上传刚才下载的CSV文件(本地可以编辑修改,去掉无关的URL)

3. 点击“新建抓取工具”,这时会自动打开一个URL,可视化点击想要抓取的内容区域,支持Shift多选,比如先点选标题,再点击内容部分。

运行后,会自动访问每个网页抓取你指定的内容,可以下载成CSV或JSON。 https://pbs.twimg.com/media/GTqPepeacAAvfzB.png https://pbs.twimg.com/media/GTqPlA7bgAAUobm.jpg https://pbs.twimg.com/media/GTqP00sa4AAnT_U.jpg https://pbs.twimg.com/media/GTqQEQFawAASCHa.jpg