一款很好用的浏览器抓取插件 Easy Scraper - One-click web scraper https://t.co/n2tDc5sHhn 抓取网页,一般从获取URL列表开始,然后抓取详情页。 比如我想读英语故事学英语,想采集100wordstory网站内容导入到Heptabase,每天学一篇。 1. 打开 https://t.co/1YXBoYGtHL 点击插件图标,它会自动提取页面中URL,支持下载为CSV或JSON。 2. 切换为“抓取详情页”,上传刚才下载的CSV文件(本地可以编辑修改,去掉无关的URL) 3. 点击“新建抓取工具”,这时会自动打开一个URL,可视化点击想要抓取的内容区域,支持Shift多选,比如先点选标题,再点击内容部分。 运行后,会自动访问每个网页抓取你指定的内容,可以下载成CSV或JSON。 https://pbs.twimg.com/media/GTqPepeacAAvfzB.png https://pbs.twimg.com/media/GTqPlA7bgAAUobm.jpg https://pbs.twimg.com/media/GTqP00sa4AAnT_U.jpg https://pbs.twimg.com/media/GTqQEQFawAASCHa.jpg