【开源】网页内容提取器
201浏览 • 2025-8-2 •
科技综合
• MA107644
https://github.com/Amoyens1s/web-content-extract
https://www.npmjs.com/package/web-content-extract
分享下我的新开源项目,web-content-extract,基于Mozilla Readability,能提取网页正文内容并转换为Markdown。支持CLI和库两种使用方式,可同时获取SEO元数据,实现网页内容结构化提取,适合做信息聚合、知识管理等场景
技术栈为typescript
35