《如何解决 agent 无法提取小红书标题的问题》

我之前发过一个推文,说现在客户端 AI agent 有两类,一个是浏览器里面的(比如 comet),一个是命令行里面的(比如 cc 或者 gemini cli)

二者获取的数据不同,如果要得到本地电脑里面的数据,就用命令行里面的 cc/gemini cli,如果要获取浏览器里面的数据,就用 AI 浏览器

其中一个案例是,比如我要批量提取某个博主的短视频标题,cc/gemini cli 就拿不到数据,comet 可以拿到

但是有个问题没解决,就是比如小红书这种页面是用 DOM 动态加载的内容,即便是 comet 也搞不到自身浏览器里面的数据

前两天谷歌发布了 Chrome DevTools MCP,把 gemini cli 和 chrome 浏览器打通了,这个问题被解决了,现在通过命令行里面的 gemini cli,就可以爬取小红书 DOM 结构里面的数据
 
 
Back to Top