翼度科技»论坛 云主机 经验交流 查看内容

海洋cms设置宝塔自动采集教程

6

主题

6

帖子

198

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
198
第一步:获取脚本代码。
【1】下面是自动采集脚本代码,我们需要修改代码里面的3项后才可以使用。

  1. #!/bin/bash
  2. ########################################################
  3. # 程序名称: 海洋CMS自动采集脚本
  4. # 版本信息:seacmsbot/ v2.0
  5. # 发布链接: https://www.seacms.net/
  6. # 使用方法:直接复制代码到宝塔计划任务shell脚本内容里添加每小时任务使用
  7. # 更新时间:2019.9.26
  8. ##########################################################
  9. #①请修改下面的网站域名及管理目录
  10. web_site="http://网站域名/管理目录/admin_reslib2.php"
  11.   
  12. #②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)
  13. web_pwd="8888e82e85bd4540f0defa3fb7a8e888"
  14.   
  15. #③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。
  16. #每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。
  17. web_api=(
  18.    
  19.       '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php'
  20.      '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'
  21.   
  22. )
  23. #模拟用户浏览器ua,请勿随意修改,以免被目标防火墙拦截!
  24. web_ua="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)
  25. Chrome/76.0.3809.100 Safari/537.36 seacmsbot/1.2;"
  26.   
  27. #采集单页
  28. function get_content() {
  29.   echo  "正在采集第$page页..."
  30.   #echo  " get_content: --->url:--->$1"
  31.   cResult=$(curl  --connect-timeout 10 -m 20  -k -s   -L -A "$web_ua"  "$1" )
  32.   echo $cResult | grep -q "采集"
  33.   #echo  -e  "$1\n$cResult"
  34. if [ "$?" = "0" ]; then
  35.      next_content "$cResult"
  36. else
  37.     echo  -e "采集失败,请检查设置!\n失败链接-->$1\n返回信息-->$cResult\n采集结束,共0页"
  38. fi
  39. }
  40. #采集下页
  41. function next_content() {
  42.     #统计数据
  43.      Result=$(echo "$1" | tr "
  44. " "\n")
  45.      a=$(echo "$Result" | grep -c  "采集成功")
  46.      b=$(echo "$Result" | grep -c  "更新数据")
  47.      c=$(echo "$Result" | grep -c  "无需更新")
  48.      d=$(echo "$Result" | grep -c  "跳过")
  49.      echo "采集成功-->已更$c部,新增$a部,更新$b部,跳过$d部"
  50.      let add+=$a
  51.      let update+=$b
  52.      let none+=$c
  53.      let jmp+=$d
  54.     #检测并采集下页
  55.      next_url=${1##*location.href=\'}
  56.      next_url=${next_url%%\'*}
  57.       #echo $next_url
  58.       if [ "${next_url:0:1}" = "?" ]
  59.           then
  60.           let page++
  61.           get_content "$web_site$next_url"
  62.     else
  63.          echo "采集结束,共$page页"
  64.        fi  
  65. }
  66. #脚本入口
  67. echo "海洋CMS自动采集脚本开始执行 版本:v1.2"
  68. starttime=$(date +%s)
  69. update=0  #更新
  70. add=0     #新增
  71. none=0  #无变化
  72. jmp=0  # 跳过
  73. for url in ${web_api[@]};
  74. do  
  75. if [[ ! -z $url ]]
  76.      then
  77.            web_param="$web_site$url&password=$web_pwd"
  78.            page=1
  79.            echo "开始采集:$url"
  80.            get_content $web_param
  81.   fi
  82. done
  83. endtime=$(date +%s)
  84. echo "============================"
  85. echo "入库-->$add部"
  86. echo "更新-->$update部"
  87. echo "跳过-->$jmp部(未绑定分类或链接错误)"
  88. echo "今日-->$[none+add+update]部"
  89. echo "============================"
  90. echo  "全部采集结束,耗时$[endtime - starttime]秒"
复制代码
第二步:修改脚本
【2】具体修改脚本里面的哪3项呢?下面为你一一说来。(根据上面提供的代码内容复制到记事本或是其他html编辑器来对应修改)

#①请修改下面的网站域名及管理目录
  1. web_site="http://网站域名/管理目录/admin_reslib2.php"
复制代码
这个是需要修改成你的“网站域名”和“海洋cms后台的管理目录”。域名大家都能理解,后台的管理目录这个对于新手来说需要多讲两句,首先你要能登录你的后台才可以知道你的后台目录。举例说明:假如我的后台登录地址是 mytheme.cn/xxxx/那么这里的“xxxx”就是后台的管理目录,得到了管理目录我们直接填写到代码里即可。

#②请修改下面项内容为"admin_reslib2.php"里设置的访问密码(默认为系统设置的cookie密码)
  1. web_pwd="8888e82e85bd4540f0defa3fb7a8e888"
复制代码
这个修改需要到海洋cms系统后台得到我们的cookie密码进行替换才可以,具体步骤:系统-网站设置-cookie密码。得到自己网站的cookie密码后替换即可。

#③下面项内容为资源站每日采集链接地址列表,请自行修改,每行一条,可添加多个,前后需添加引号。
#每日采集链接获取方法:选择"后台-采集-资源库列表",复制资源站右边的"采集每天"的链接地址,去掉?前面的内容。
  1. web_api=(
  2.    
  3.       '?ac=day&rid=1&url=https://api.iokzy.com/inc/ldg_seackm3u8s.php'
  4.      '?ac=day&rid=2&url=http://www.zdziyuan.com/inc/s_ldgm3u8_sea.php'  
  5. )
复制代码
这个是代码里需要修改的最后一项,里面是代码里默认提供的2个采集链接地址,我们需要获取自己的采集链接地址添加到里面。

第三步:宝塔定时任务设置。
直接复制代码到宝塔计划任务shell脚本,内容里添加每小时任务使用。

上一篇: 没有了

下一篇: 手把手教你为Discuz配置Redis缓存

举报 回复 使用道具