Yearly Archives

26 Articles

awk(又是awk)高亮顯示nginx日誌

7   12273 轉為簡體

請叫我awk小(nao)王(can)子(fen)

效果

awk分析日誌統計當日熱門頁面

0   25651 轉為簡體

不想寫python,而且我比較相信awk+uniq+sort的速度

  •  cron的時區很奇怪,不會調,系統時間是+8,tail /var/log/syslog之後發現是西五區,手動+13小時 可以通過修改localtime,修改完之後重啟service cron(還是重啟系統好了)參閱
  • 第一步取出所有日期是今天且響應是200的請求,打印請求ip和請求uri
  • 第二、三步對(ip uri)排序,去重,單個ip訪問單個頁面只會被記為一次
  • 打印uri,去重,排序,顯示前50個

 

time計時

52M日誌,26w條

134M日誌,加上了兩個自定義條件,65w條

小站可以考慮

在某網站中使用的字幕文件名猜測視頻文件名的算法

2   71191 轉為簡體

覺得有點意思,拿出來和大家一起研究下,歡迎提供更好的建議。

因為爬x手的時候,網頁已經沒了,只能自食其力;用unrar(rarlab上下的,apt-get里的太古老)獲得rar內的文件名,用zipfile模塊列zip包的,抓的時候直接把返回的內容插到數據庫了,沒分析,因為沒那麼多時間去想算法,還是先把dirty data擼下來再說。

然後開始正文了www

按照這麼一個基本思想,字幕文件名除了擴展名以外,其餘部分和視頻文件是一樣的。如果壓縮包裡面只有一個文件,那麼直接就是它去掉擴展名就好了;但是如果有多個版本的字幕(比如eng,GB,BIG5等),那就需要一個字符串最大匹配的算法。←為了裝B取的名字
Read More

win8平板推黃油時提示Initializing DirectInput failed的解決方案

0   15305 轉為簡體

win8平板推黃油時提示Initializing DirectInput failed,插上鼠標就不提示,應該是找不到mouse device的關係

google了一下fake mouse device,第一個結果就找到了答案

11樓寫到

Update-

Enabling “mouse keys”, a Windows accessibility feature, allows games to detect a mouse on touch devices.
http://www.microsoft.com/enable/trai…ic-keypad.aspx

I’m working out which TBS and RTS games work well with touch……

按照渣軟的提示打開了這個黑科技:

  1. 右邊角滑出菜單,選擇設置->更改電腦設置
  2. 選擇輕鬆使用
  3. 選擇鼠標
  4. 打開使用數字小鍵盤在屏幕上移動鼠標

就好了lol;win8.1同樣適用

優酷超清視頻(kux)壓制mkv腳本

0   7025 轉為簡體

優酷客戶端下載的[超清]清晰度視頻會被保存為kux格式。其實這個格式就是一堆分段的flv。

頭上應該還有索引之類的,懶得分析了其實是分析不出來

因為木有索引,我們只能自己判斷flv段何時開始,何時結束;因為flv文件頭特徵不明顯其實是想裝b,我們需要分析flv的格式。

在參考這篇博客之後,寫了個腳本

拖出了所有flv之後,我們用mkvmerge來合體

完整腳本在gist上可以找到

 

解包之後很有快感啊