小红书高分笔记爬取

yichael 21738fd6d5 完美 преди 1 месец
.cursor d731a5c555 完美 преди 1 месец
bat-tool ab7e01b8d4 获取所有图文简介 преди 1 месец
python 21738fd6d5 完美 преди 1 месец
resources ffb8daca65 小红书输入关键字 преди 1 месец
workplace 21738fd6d5 完美 преди 1 месец
.gitignore ab7e01b8d4 获取所有图文简介 преди 1 месец
README.md ffb8daca65 小红书输入关键字 преди 1 месец
bring-cmd-window-foreground.ps1 0c79e6fbe6 整体流程完美 преди 1 месец
config.ini ffb8daca65 小红书输入关键字 преди 1 месец
requirements.txt 0c79e6fbe6 整体流程完美 преди 1 месец
start.bat 21738fd6d5 完美 преди 1 месец

README.md

小红书

本仓库在 workplace/ 下开发:用浏览器自动化根据关键词在小红书搜索结果中定位并处理内容,目标为根据关键词搜索排名最高的笔记,并采集所需素材。

实现逻辑

根据 Playwright 在浏览器内获取元素位置,再通过「元素位置 + 屏幕尺寸 + 浏览器窗口大小」换算出元素在屏幕上的具体坐标,通过模仿真人操作(PyAutoGUI)获取想要的素材。

新建项目时的命令行

Playwright(Python)

pip install playwright
python -m playwright install

PyAutoGUI

pip install pyautogui