Category Archives

28 Articles

Coreseek4.x/5.x編譯和一些注意事項

0   8979 轉為簡體

使用ubuntu/debian系統32位的可以在這裡下載我編譯好的coreseek5/csft包

對於>2.2.10的版本,我在這篇博客里提供了完整的補丁,可以應用在sphinx的源碼上編譯。

編譯mmseg

 編譯coreseek5

自動腳本有一些bug :

  • 手動運行一次autoconf和automake
  • ./configure xxxx之後,修改src/Makefile在LIBS加上-L/usr/local/mmseg3/lib  -lmmseg
  • am__object_1 增加 tokenizer_zhcn.$(OBJEXT)
  • SRC_SPHINX增加tokenizer_zhcn.cpp
  • gcc 5.不知道多少版本以後會腦殘,sphinx.cpp里有個地方要加上this->,忘記具體變量了,沒關係gcc會告訴你在哪的

 

如果用4.1的話不能用最新版的sphinxclient,可以去sphinx_php_api的trunk里找define ( “VER_COMMAND_SEARCH”, 0x117 );的版本(0x117 ->1.23)

 

最後貼一個圖來表達對xunsearch的…………

又慢(搜索比sphinx慢5~10倍,索引體積比原始數據大7倍,比sphinx大21倍),結果又少(mysql模糊搜索≈coreseek搜索≈740+,這貨只有114,$search->count獲得的精確值是286條)

另外ini文件名和裡面填的project_name不一致會神作

告訴我是我打開方式不對

在某網站中使用的字幕文件名猜測視頻文件名的算法

2   69114 轉為簡體

覺得有點意思,拿出來和大家一起研究下,歡迎提供更好的建議。

因為爬x手的時候,網頁已經沒了,只能自食其力;用unrar(rarlab上下的,apt-get里的太古老)獲得rar內的文件名,用zipfile模塊列zip包的,抓的時候直接把返回的內容插到數據庫了,沒分析,因為沒那麼多時間去想算法,還是先把dirty data擼下來再說。

然後開始正文了www

按照這麼一個基本思想,字幕文件名除了擴展名以外,其餘部分和視頻文件是一樣的。如果壓縮包裡面只有一個文件,那麼直接就是它去掉擴展名就好了;但是如果有多個版本的字幕(比如eng,GB,BIG5等),那就需要一個字符串最大匹配的算法。←為了裝B取的名字
Read More

白貓Project/白貓プロジェクト 作死

11   57313 轉為簡體

這貨貌似是賣萌黑貓根本不是續作

我開始想不加殼就算了,java不混淆就算了,加密的so一模一樣的是來坑爹的吧www MD5都一樣的摔

後來我發現被坑了

原來那一段AES密鑰不是給遊戲通信用的233

然後我就發現了原來不是這樣的2333

但是終究還是搞定了23333

CryptoPrefs

用於加密userHash和登陸token,保存在key=md5(‘Account’)的shared_prefs中;AES-128-CBC, ZerosPadding

Cipher

除首次進入遊戲外,以後登陸都是用userHash做key;AES-256-CBC, PKCS7

好好好可以作死了

←Click me

附:ARM F5之後的getKeySpec偽代碼,證明之前的猜想是正確的 Read More