一日一技:HTML 里面提取的 JSON 怎么解析不了?

谢乾坤|青南 at 
我们在开发爬虫的过程中,经常发现有一些网站,会直接把数据以 JSON 的形式,通过标签放到页面源代码中。如下图所示:有时候请求 URL 拿到 HTML 的过程比较麻烦,有些同学习惯先把 HTML 复制到代码里面,先把解析的逻辑写好,然后再去开发请求 HTML 的代码。这个思路本身是没有什么问题的,于是他们就写了如下的代码:代码中的 html_data = '''里面就是原样复制的网页 HTML,没有做任何修改,因为太长了,我这里做了折叠。展开以后如下图所示:但当运行这段代码的时候,发现代码报错了,如下图所示:看这个报错信息,难道说是 JSON 本身有问题?于是,你到网页上,把这个 JSON 复……