GnePro:文章类通用爬虫接口

谢乾坤|青南 at 
GnePro 是开源项目 GNE 的付费版,能够实现如下功能:输入任意文章页面的 URL,返回标题/作者/正文/发布时间/图片/面包屑等一系列信息支持异步加载文章页提取支持上传自定义的 HTML 代码提取正文支持自动检测网页编码支持自动提取网页全部 URL 在 8 个国家 13 万个新闻类网站进行测试,准确率高达 90%提取文章正文 12345678910111213141516171819import requestsimport jsonurl = "https://crawler.kingname.info/gne/crawl"body = { "url": "https://www.……