• 售前

  • 售后

热门帖子
入门百科

wordpress抓取文章第一张远程图片生存到本地的方法

[复制链接]
Jacqueline季 显示全部楼层 发表于 2021-8-15 20:02:26 |阅读模式 打印 上一主题 下一主题
这个动作我们使用一个hook来实现:

复制代码代码如下:
add_action('publish_post', 'fetch_images',999);

再创建一个fetch_images函数,来实现本文所说的全部功能。

复制代码代码如下:
function fetch_images( $post_ID ){
    if ( defined('DOING_AUTOSAVE') && DOING_AUTOSAVE ) return;
    if ( !current_user_can('edit_post', $post_ID) ) return;
    $post = get_post($post_ID);

接下来,我们要获取文章内容中的第一张图片:

复制代码代码如下:
$first_image = '';
    preg_match('/<img.+src=[\'\"]([^\'\"]+)[\'\"].* \/>/i',$post->post_content,$images);
    if(!empty($images))foreach($images as $image){
        if(strpos($image,'http') === 0){
            $first_image = $images[1];
            break;
        }
    }

但现实上,通过上述的代码获得的图片src大概也是有题目的,大概根本没有抓取到数据。不过我们先不考虑这些题目,我们先实现本文的目的。
接下来就是关键代码一,它要实现“抓取-生存到当地”两个功能:

复制代码代码如下:
$get = wp_remote_get( $get_image_src );
$type = wp_remote_retrieve_header( $get, 'content-type' );
$file_name = basename($get_image_src);
$file_content = wp_remote_retrieve_body($get);
$mirror = wp_upload_bits($file_name,null,$file_content);

这个地方有一个厘革,上面我们获得了$first_image,这个地方的$get_image_src是上述得到的要抓取的长途图片地址。
在WordPress中,提供了wp_remote_get、wp_remote_retrieve_body等原创抓取和信息获取函数,你可以检察官方文档以相识和remote相关的函数。wp_upload_bits则将抓取到的图片的二进制内容生存到当地,根据其文件范例,最终成为当地生存的图片,并将生存完后获得的当地图片信息生存在$mirror中。
既然已经生存到当地了,接下来就是将图片信息生存到数据库中。

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作