不想写python,而且我比较相信awk+uniq+sort的速度

  •  cron的时区很奇怪,不会调,系统时间是+8,tail /var/log/syslog之后发现是西五区,手动+13小时 可以通过修改localtime,修改完之后重启service cron(还是重启系统好了)参阅
  • 第一步取出所有日期是今天且响应是200的请求,打印请求ip和请求uri
  • 第二、三步对(ip uri)排序,去重,单个ip访问单个页面只会被记为一次
  • 打印uri,去重,排序,显示前50个

 

time计时

52M日志,26w条

134M日志,加上了两个自定义条件,65w条

小站可以考虑