我想抓取网页中的信息。查询号码归属地的一个页面如下所示:
http://guishu.showji.com/search.htm?m=13900008888
我在Chrome中查看该网页的源代码,却看到对应“归属省份:新疆”的地方为:
<li>归属省份:<span id="txtProvince"></span></li>
那么我该如何抓取“新疆”这个信息呢?为什么它没有直接显示在html文件中呢?
非常感谢!
亲,这个标签里面的省份是动态获取的,也就是不是固定的,你查看源代码的方式只能看到网页原来的样子,而没有看到网页动态加载后的样子,你要右键点击省份那里选择审查元素就看见动态加载的内容,直接获取消息还是用
document.getElementById("txtProvince"),但是要等到页面加载完后才能获取到
要抓取的地址应该是这个
$str = 'http://v.showji.com/locating/showji.com.aspx?m=13900008888&output=json&callback=querycallback×tamp=1413972643837';