Yearly Archives

26 Articles

awk(又是awk)高亮显示nginx日志

7   9085 转为繁体

请叫我awk小(nao)王(can)子(fen)

效果

awk分析日志统计当日热门页面

0   23739 转为繁体

不想写python,而且我比较相信awk+uniq+sort的速度

  •  cron的时区很奇怪,不会调,系统时间是+8,tail /var/log/syslog之后发现是西五区,手动+13小时 可以通过修改localtime,修改完之后重启service cron(还是重启系统好了)参阅
  • 第一步取出所有日期是今天且响应是200的请求,打印请求ip和请求uri
  • 第二、三步对(ip uri)排序,去重,单个ip访问单个页面只会被记为一次
  • 打印uri,去重,排序,显示前50个

 

time计时

52M日志,26w条

134M日志,加上了两个自定义条件,65w条

小站可以考虑

在某网站中使用的字幕文件名猜测视频文件名的算法

2   68184 转为繁体

觉得有点意思,拿出来和大家一起研究下,欢迎提供更好的建议。

因为爬x手的时候,网页已经没了,只能自食其力;用unrar(rarlab上下的,apt-get里的太古老)获得rar内的文件名,用zipfile模块列zip包的,抓的时候直接把返回的内容插到数据库了,没分析,因为没那么多时间去想算法,还是先把dirty data撸下来再说。

然后开始正文了www

按照这么一个基本思想,字幕文件名除了扩展名以外,其余部分和视频文件是一样的。如果压缩包里面只有一个文件,那么直接就是它去掉扩展名就好了;但是如果有多个版本的字幕(比如eng,GB,BIG5等),那就需要一个字符串最大匹配的算法。←为了装B取的名字
Read More

win8平板推黄油时提示Initializing DirectInput failed的解决方案

0   11372 转为繁体

win8平板推黄油时提示Initializing DirectInput failed,插上鼠标就不提示,应该是找不到mouse device的关系

google了一下fake mouse device,第一个结果就找到了答案

11楼写到

Update-

Enabling “mouse keys”, a Windows accessibility feature, allows games to detect a mouse on touch devices.
http://www.microsoft.com/enable/trai…ic-keypad.aspx

I’m working out which TBS and RTS games work well with touch……

按照渣软的提示打开了这个黑科技:

  1. 右边角滑出菜单,选择设置->更改电脑设置
  2. 选择轻松使用
  3. 选择鼠标
  4. 打开使用数字小键盘在屏幕上移动鼠标

就好了lol;win8.1同样适用

优酷超清视频(kux)压制mkv脚本

0   5009 转为繁体

优酷客户端下载的[超清]清晰度视频会被保存为kux格式。其实这个格式就是一堆分段的flv。

头上应该还有索引之类的,懒得分析了其实是分析不出来

因为木有索引,我们只能自己判断flv段何时开始,何时结束;因为flv文件头特征不明显其实是想装b,我们需要分析flv的格式。

在参考这篇博客之后,写了个脚本

拖出了所有flv之后,我们用mkvmerge来合体

完整脚本在gist上可以找到

 

解包之后很有快感啊