小红书高分笔记爬取

yichael 21738fd6d5 完美 1 mês atrás
.cursor d731a5c555 完美 1 mês atrás
bat-tool ab7e01b8d4 获取所有图文简介 1 mês atrás
python 21738fd6d5 完美 1 mês atrás
resources ffb8daca65 小红书输入关键字 1 mês atrás
workplace 21738fd6d5 完美 1 mês atrás
.gitignore ab7e01b8d4 获取所有图文简介 1 mês atrás
README.md ffb8daca65 小红书输入关键字 1 mês atrás
bring-cmd-window-foreground.ps1 0c79e6fbe6 整体流程完美 1 mês atrás
config.ini ffb8daca65 小红书输入关键字 1 mês atrás
requirements.txt 0c79e6fbe6 整体流程完美 1 mês atrás
start.bat 21738fd6d5 完美 1 mês atrás

README.md

小红书

本仓库在 workplace/ 下开发:用浏览器自动化根据关键词在小红书搜索结果中定位并处理内容,目标为根据关键词搜索排名最高的笔记,并采集所需素材。

实现逻辑

根据 Playwright 在浏览器内获取元素位置,再通过「元素位置 + 屏幕尺寸 + 浏览器窗口大小」换算出元素在屏幕上的具体坐标,通过模仿真人操作(PyAutoGUI)获取想要的素材。

新建项目时的命令行

Playwright(Python)

pip install playwright
python -m playwright install

PyAutoGUI

pip install pyautogui