花糕

【开源】网页内容提取器

201浏览 2025-8-2 科技综合 MA107644

https://github.com/Amoyens1s/web-content-extract

https://www.npmjs.com/package/web-content-extract


分享下我的新开源项目,web-content-extract,基于Mozilla Readability,能提取网页正文内容并转换为Markdown。支持CLI和库两种使用方式,可同时获取SEO元数据,实现网页内容结构化提取,适合做信息聚合、知识管理等场景

技术栈为typescript

#开源 #爬虫 #typescript
35