我之前发过一个推文,说现在客户端 AI agent 有两类,一个是浏览器里面的(比如 comet),一个是命令行里面的(比如 cc 或者 gemini cli)
二者获取的数据不同,如果要得到本地电脑里面的数据,就用命令行里面的 cc/gemini cli,如果要获取浏览器里面的数据,就用 AI 浏览器
其中一个案例是,比如我要批量提取某个博主的短视频标题,cc/gemini cli 就拿不到数据,comet 可以拿到
但是有个问题没解决,就是比如小红书这种页面是用 DOM 动态加载的内容,即便是 comet 也搞不到自身浏览器里面的数据
前两天谷歌发布了 Chrome DevTools MCP,把 gemini cli 和 chrome 浏览器打通了,这个问题被解决了,现在通过命令行里面的 gemini cli,就可以爬取小红书 DOM 结构里面的数据