Category Archives

149 Articles

awk分析日志统计当日热门页面

0   28857 转为繁体

不想写python,而且我比较相信awk+uniq+sort的速度

  •  cron的时区很奇怪,不会调,系统时间是+8,tail /var/log/syslog之后发现是西五区,手动+13小时 可以通过修改localtime,修改完之后重启service cron(还是重启系统好了)参阅
  • 第一步取出所有日期是今天且响应是200的请求,打印请求ip和请求uri
  • 第二、三步对(ip uri)排序,去重,单个ip访问单个页面只会被记为一次
  • 打印uri,去重,排序,显示前50个

 

time计时

52M日志,26w条

134M日志,加上了两个自定义条件,65w条

小站可以考虑

在某网站中使用的字幕文件名猜测视频文件名的算法

2   74786 转为繁体

觉得有点意思,拿出来和大家一起研究下,欢迎提供更好的建议。

因为爬x手的时候,网页已经没了,只能自食其力;用unrar(rarlab上下的,apt-get里的太古老)获得rar内的文件名,用zipfile模块列zip包的,抓的时候直接把返回的内容插到数据库了,没分析,因为没那么多时间去想算法,还是先把dirty data撸下来再说。

然后开始正文了www

按照这么一个基本思想,字幕文件名除了扩展名以外,其余部分和视频文件是一样的。如果压缩包里面只有一个文件,那么直接就是它去掉扩展名就好了;但是如果有多个版本的字幕(比如eng,GB,BIG5等),那就需要一个字符串最大匹配的算法。←为了装B取的名字
Read More

优酷超清视频(kux)压制mkv脚本

0   10616 转为繁体

优酷客户端下载的[超清]清晰度视频会被保存为kux格式。其实这个格式就是一堆分段的flv。

头上应该还有索引之类的,懒得分析了其实是分析不出来

因为木有索引,我们只能自己判断flv段何时开始,何时结束;因为flv文件头特征不明显其实是想装b,我们需要分析flv的格式。

在参考这篇博客之后,写了个脚本

拖出了所有flv之后,我们用mkvmerge来合体

完整脚本在gist上可以找到

 

解包之后很有快感啊

白猫Project/白猫プロジェクト 作死

11   65995 转为繁体

这货貌似是卖萌黑猫根本不是续作

我开始想不加壳就算了,java不混淆就算了,加密的so一模一样的是来坑爹的吧www MD5都一样的摔

后来我发现被坑了

原来那一段AES密钥不是给游戏通信用的233

然后我就发现了原来不是这样的2333

但是终究还是搞定了23333

CryptoPrefs

用于加密userHash和登陆token,保存在key=md5(‘Account’)的shared_prefs中;AES-128-CBC, ZerosPadding

Cipher

除首次进入游戏外,以后登陆都是用userHash做key;AES-256-CBC, PKCS7

好好好可以作死了

←Click me

附:ARM F5之后的getKeySpec伪代码,证明之前的猜想是正确的 Read More