公司新闻
 
百度新闻采集
 

  百度新闻是百度公司推出的中文新闻搜索平台,每天发布多条新闻,算是一个比较全的新闻获取方式了。

  1)打开网页之后,鼠标选中第一个新闻列表的标题,系统会自动识别出其他相似的链接,然后在右面的提示框中选择“选中全部”

  1)进入列表详情页面,鼠标选中文章内容第一段,系统会自动识别出其他相似的链接,然后在右面的提示框中选择“选中全部”,

  1)选中整个“循环步骤”,打开“高级选项”,可以看到,八爪鱼默认生成的元素列表的Xpath并不能定位到所有的文章,所以需要修改

  2)在火狐浏览器中打开要采集的网页并观察源码。观察网页源码,修改此条Xpath为:“//p”, 将修改后的Xpath,复制粘贴到八爪鱼中所示位置,然后点击“确定”。

  2)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出,一份完好的百度新闻内容数据就导出好了,这里我们选择excel作为导出为格式,数据导出后如下图。

 
产品搜索:
最新产品
联系方式