查看内容

简易PHP抓网页

  • 2020-04-30 06:47
  • 编程人生
  • Views

不包括抓图片?$buffer = file(address); //$address 网页地址for($i = 0;i sizeof($buffer);$i++){ //去yahoo广告 $buffer[$i] = str_replace(''!----- ad start -----'',''noscrīpt'' $buffer[$i]); $buffer[$i] = str_replace(''!----- ad end -----'',''/noscrīpt'' $buffer[$i]); //最后显示 echo($buffer);}?str_replace 3个参数 ,第一个是原文件的内容,第二个是替换成的内容.最后一个是写入的地方.$buffer能取得整个html页面的文本档,成为一个数组,每行一个元素,简单的说就是逐行寻找替换.替换后输出.同样的可以把烂掉的无法显示的页面 例如成为 这样的替换成对应网址.替换前查看下原HTML档对比下就行.