PHP 实现采集网站数据的方法总结

在一些企业网站的应用中,一些企业可能没有时间去管理自己的网站,定时发布一些相关的新闻资讯到网站中,这时候就需要程序自动去网络上抓取一下自己企业相关的新闻和行业资讯到自己的网站中,这里就需要用到PHP的数据抓取技术,术语称为数据采集。

W3CAPI
1
2020-04-24 22:25:16
文档目录
我的书签
 

PHP 使用file_get_contents函数实现数据采集

file_get_contents函数可以直接打开一个给定的URL地址,但是需要在php.ini的中进行配置:在php.ini中搜索allow_url_fopen,然后设置allow_url_fopen=On 即可,实现代码如下:
function collect_by_url($url) {
    //使用file_get_contents()
    $data=file_get_contents($url);
    return $data;
}

$url = "http://www.w3capi.com/cms/column/id/4.html";
var_dump( collect_by_url($url) );
返回结果和使用cURL一样,看来它也对http协议请求进行了内容处理的封装。
友情提示