中文偽春菜後援會論壇  

打印

[閒聊] 偽春菜的問題與解答

引用:
原帖由 TanisElf 於 2009-7-22 14:53 發表

嗯~原作者連結我也是從saori collection那邊找到的(はるのくまつち ),應該是正常才對。
http://umeici.hp.infoseek.co.jp/etcetera/saoricollect.html

至於另一個問題,我這樣寫可以正常執行:
FUNCTIONEX("saori\httpc.dl ...
最新版在這裡。
http://code.google.com/p/satoriya-shiori/


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 TanisElf 於 2009-7-22 21:07 發表
httpc.dll看來只能用在日文模式了。
根據我從除錯工具裡面抓到的訊息,httpc.dll傳回給SSP的是日文編碼,也就是說抓到的資料雖然是UTF-8,

1814
如紅框中,回傳訊息時,httpc自己又把內容從UTF-8轉回日文,結果就導致亂碼或是落 ...
source code要重寫:
複製內容到剪貼板
代碼:
        // プラグインを実行
        deque<string>        theValues;
        string        theResult = Saori::getInstance().request(theArguments, theValues);
        theArguments.clear();        // もう使わない


        // レスポンス文字列を作成
        string        theResponce =
                        "SAORI/1.0 200 OK\x0d\x0a"
                        "Charset: Shift_JIS\x0d\x0a";
        theResponce += string("Result: ") + theResult + "\x0d\x0a";

/* ... */

        /* 後処理 */
        InternetCloseHandle(hFile);
        InternetCloseHandle(hInternet);

        // 文字列終端。Unicodeの場合を考えて4byte。
        for (int i=0 ; i<4 ; ++i)
                theData.push_back(0);
       
        oResult.assign(theData.begin(), theData.size());

        // 文字コードの判別・変換
        if ( opt.find("jis") != opt.end() )
                oResult = jis2sjis(oResult);
        else if ( opt.find("euc") != opt.end() )
                oResult = euc2sjis(oResult);
        else if ( opt.find("utf8") != opt.end() )
                oResult = UTF8toSJIS(oResult);
        /*else if ( opt.find("UTF-16LE") != opt.end() )
                NULL;
        else if ( opt.find("UTF-16BE") != opt.end() )
                NULL;*/
        else if ( opt.find("sjis") != opt.end() )
                NULL;
        else
                oResult = convertSomethingToSJIS(oResult.c_str());
P.S.: 在整備班bug track中開ticket了。
http://ssp.shillest.net/bts/gues ... d=56&project=ms


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-7-23 13:19 發表
原來如此,感謝感謝!
等新版\(^o^)/
http://code.google.com/p/csaori/ ... k/chttpc/chttpc.cpp
剛開始重寫。
也將時原砂さん加到 maintainers 中了,希望他除了維護 SQLori 外也幫忙一起重寫 httpc。


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 時原砂 於 2009-7-25 21:49 發表

雖說如此但我很懷疑我能幫到多少的忙...XD"
今天光是搞定SVN就花了n久的時間 (囧)
svn裝個小烏龜(TortoiseSVN)不就好了 XD


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 時原砂 於 2009-7-26 00:39 發表
問題是出在小烏龜死咬著以前下載的某個專案
怎麼刪都刪不掉
上網查了很久還是找不到原因後
只好砍掉重練了...(默)

目前主要在研究gainer的DirectSSTP部份
看能不能寫個完整的類別可供其他專案直接套用
(或者有現成 ...
請svn update chttpc。
DirectSSTP已經有class了(CSAORIDSSTP)。
CInetHelper已處理get和check。

P.S.:svn commit時煩請務必把log message打上(這次修改改了什麼…之類),中/英/日文皆可。
這是一個對自己的修改負責任的表現。


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 時原砂 於 2009-7-26 10:39 發表
第一次上傳所以還在摸索
結果傳上去後才發現log沒有貼上去
也不知道該怎麼補...(囧)

chttpc的話有點無從下手...
短時間內應該還是會把重心放在Sqlori ...
chttpc Thread.h/Thread.cpp應該可以拿來用…same license嘛 (^^;)
反而translate我在考慮其他的solution…


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

rev 100 up.
應該把所有該有的function都實裝了,但還沒測試。
需要人測試…


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

(正式版已出,beta版撤下。)

用法:

  • - 無引數: 檢查能否上網,回傳: 1 - OK, 0 - NG
  • - 一個引數(網址): 下載並直接回傳
  • - 多過一個引數:

    • 第一個必須為網址
    • 之後的選項:

      • translate - 嘗試轉換html為sakura script
      • strip - 去除html tag
      • codepage=<編碼名稱> - 指定來源編碼 (如: big5、x-sjis。預設chttpc會偵測HTML編碼。指定50001會自動偵測。)
      • save=<檔名> - 把剛下載的檔案存為「檔名」(與chttpc.dll同位置)
      • saveUtf8=<檔名> - 把剛下載的檔案以UTF-8編碼存為「檔名」(與chttpc.dll同位置,b1新增)
      • saveParsed=<檔名> - 把處理好的數據存為「檔名」(與chttpc.dll同位置)
      • start=<字串> 及 end=<字串> - 回傳在 start 和 end 之間字串
      • hwnd=<hwnd> 及 id=<字串> - 背景執行。會經 DirectSSTP 向 hwnd 回傳 OnchttpcNotify (ref0: id, ref1: 回傳值, ref2: 網址)
      • noOutput - 不回傳 (a2新增)




已知bug:

  • translate 未能正確處理巢狀標籤 (如 <li><a>) (相信在beta 1中已修正)


由最初版之更新(svn log原文):
複製內容到剪貼板
代碼:
r120 | roytam | 2009-08-04 21:53:03 +0800 (Tue, 04 Aug 2009) | 1 line
update README.txt for Release 2
------------------------------------------------------------------------
r119 | roytam | 2009-08-04 21:43:51 +0800 (Tue, 04 Aug 2009) | 5 lines
chttpc Release 2.

striphtml: add back old replaceAll as overReplaceAll
chttpc_runner::run: overReplaceAll cr and lf to \n, overReplaceAll all spaces to single space
CHTML2SS: some of replaceAll was replaced to overReplaceAll, make strip and translate work with start= and end= too.
------------------------------------------------------------------------
r117 | roytam | 2009-08-02 22:02:14 +0800 (Sun, 02 Aug 2009) | 4 lines
chttpc release 1.
add Lite-Release configuration for chttpc without translate function.
debug source cleanup.
remove commented CHTML2SS::translate.
r116 | roytam | 2009-08-02 09:52:15 +0800 (Sun, 02 Aug 2009) | 1 line
CHTML2SS: correct "a" tag statements.
------------------------------------------------------------------------
r115 | roytam | 2009-08-02 09:39:53 +0800 (Sun, 02 Aug 2009) | 2 lines
CHTML2SS: escape "\".
striphtml:replaceAll: don't overreplace.
r114 | roytam | 2009-08-01 19:01:38 +0800 (Sat, 01 Aug 2009) | 3 lines
chttpc beta 2.
add more information to README.txt
single_blank: adding missed another part of fix.
------------------------------------------------------------------------
r113 | roytam | 2009-08-01 18:47:58 +0800 (Sat, 01 Aug 2009) | 1 line
htmlcxx: better(slower) single_blank fix
------------------------------------------------------------------------
r112 | roytam | 2009-08-01 17:58:15 +0800 (Sat, 01 Aug 2009) | 3 lines
htmlcxx: fix single_blank for single space, still need more fixing
onchttpcNotify: add url as ref2
CHTML2SS: add more formating
------------------------------------------------------------------------
r111 | roytam | 2009-07-30 19:30:40 +0800 (Thu, 30 Jul 2009) | 5 lines
! change save= to saveUtf8=
+ add "real" save= option
! clean  up CSAORI::exec
! update README.txt for such changes.
: still leaving old CHTML2SS::translate in comment form as reference.
------------------------------------------------------------------------
r110 | roytam | 2009-07-29 21:22:15 +0800 (Wed, 29 Jul 2009) | 1 line
fix input textbox translation
------------------------------------------------------------------------
r109 | roytam | 2009-07-29 20:58:25 +0800 (Wed, 29 Jul 2009) | 1 line
update README.txt
------------------------------------------------------------------------
r108 | roytam | 2009-07-29 20:54:48 +0800 (Wed, 29 Jul 2009) | 6 lines
CHTML2SS:
- rewrite translate with sibling recursion(based on tree_utils.hh).
- better handling with Quirk HTML files.
- add support for div tag
htmlcxx: update to 0.83.
chttpc beta 1
------------------------------------------------------------------------
r107 | roytam | 2009-07-28 21:40:13 +0800 (Tue, 28 Jul 2009) | 2 lines
+ add README.txt
* chttpc alpha 2
------------------------------------------------------------------------
r106 | roytam | 2009-07-28 20:12:24 +0800 (Tue, 28 Jul 2009) | 1 line
CHTML2SS::translate : fix missing cu->path when processing a tag, add base tag support
------------------------------------------------------------------------
r105 | roytam | 2009-07-28 19:35:41 +0800 (Tue, 28 Jul 2009) | 2 lines
CHTML2SS: fix invalid previous sbling, deal with ol, better support of a tagName
chttpc: add noOutput
讓balloon變成瀏覽器!  (讓balloon中的連結有效)
複製內容到剪貼板
代碼:
OnAnchorSelect
{
        _res = FUNCTIONEX("chttpc.dll",reference0,'translate')
        _res;
}
效果:


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP



正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-4 19:42 發表
正式版試用回報:

真好用!嘿 終于可以和奇怪的坐標判斷方式告別了。
不過在用的途中突然人格當機了,檢查之后“TAMA”告訴我這行有問題:
_from = FUNCTIONEX("saori\chttpc.dll","http://www.google.cn/search?hl=zh-CN&c ...
start 和 end 建議獨立寫出來。
yaya 也要更新至 Tc535-2。
GETSTRURLENCODE 改成 STRENCODE。
複製內容到剪貼板
代碼:
                        _place = STRENCODE('北京',1,'url')
                        _start = 'start=<div style="float:left;font-size:86%;color:#6f6f6f">'
                        _end = 'end=</div>'
                        _from = FUNCTIONEX('chttpc.dll',"http://www.google.cn/search?hl=zh-CN&client=ig&q=tq+%(_place)",_start,_end);
                        _from;


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP



正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-6 17:37 發表
更新了r2,也將YAYA更新至535-2,
不過依然是有出錯:
                _start3 = 'start=';
                _end3 = 'end=';
                _from = FUNCTIONEX("saori\chttpc.dll","http://www.google.cn/search?hl=zh-CN&client=ig&q=tq+%(_place)",_start3,_en ...
碰到bug了。_start3 和 _end3 後不加分號就過了。

已file bug:
http://ssp.shillest.net/bts/gues ... d=57&project=ms


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-6 18:48 發表
………………真的是…………
太神奇了這個!
另外這個會引起同樣的錯誤:_start2 = 'start=';同樣不加分號就過了。@@

上一個(start3)去掉分號之後可以正常抽取內容出來,
下一個(start2)就不行了。
會將整個網頁都返回過來,包 ...
複製內容到剪貼板
代碼:
                        HJDicword = STRENCODE('日食',1,'url')
                        _start = 'start=<div id="com_panel_0" style="display:block;" class="jp_explain">'
                        _end = 'end=</div>'
                        _from = FUNCTIONEX('chttpc.dll',"http://dict.hjenglish.com/jp/w/%(HJDicword)&type=cj",_start,_end,'strip');
試試這個?


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

Release 3:
http://code.google.com/p/csaori/ ... ?name=chttpc.r3.zip

新增 removeTags= 選項﹐可以讓 a, img 等標籤脫光光 XD


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-10 15:09 發表
裝了r3,問題依舊。

_start = 'start='

這行不能帶有分號,帶了TAMA就報錯,
不帶則無法起到start的作用,返回的是整個網頁的內容 @@
http://cuc2.dyndns.org/redirect. ... =14696&ptid=442
這個試了沒?


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-21 16:06 發表

抱歉這么晚才回,公司搬家沒辦法測試茶兔囧||

試過了,但沒有讀取到正確的範圍。
正確範圍應該是:                     
                        〈植〉リンゴ(の木).『量』个;[塊状のもの]块;[薄片状のもの]片.  苹果酱/リ ...
Tc536-1已經修正了分號的bug。
我這邊放在yayame試是正常的。
複製內容到剪貼板
代碼:
                when "chttpctest"
                {
                        HJDicword = STRENCODE('苹果',1,'url');
                        _from = FUNCTIONEX('chttpc.dll',"http://dict.hjenglish.com/jp/w/%(HJDicword)&type=cj",'start=<div id="com_panel_0" style="display:block;" class="jp_explain">','end=</div>','translate','removeTags=img');
                        _from;

                }


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP

引用:
原帖由 貓魚 於 2009-8-29 02:50 發表
最近一直在使用這個,漸漸的有了幾個功能需求……

1,
我在抽取部分代碼的時候,如果我需要抽取的部分是處於第二個代碼範圍內、而這個範圍又沒有特別的特色的話,我就沒法抽取……
例如:這個頁面上有好幾段“”的話,我需要的s ...
1. 請用 r4 的 multiSearch 選項。然後 SPLIT(_result,CHR(2)) 切開取用。
2. 請愛用 background function XD
複製內容到剪貼板
代碼:
SAORI('chttpc.dll',_url,"id=隨便取一個名字XD","hwnd=%(sakurahwnd)")
...
OnchttpcNotify
{
        case reference0
        {
                when "隨便取一個名字XD"
                {
                        "%(reference1)"
                }
        }
}


正在聽着:
水人的格言:
有仇不報非君子!
有水不灌非魔人!

萬事皆可萌,唯有情無價

TOP



當前時區 GMT+8, 現在時間是 2020-8-9 18:35

Processed in 0.118875 second(s), 10 queries, Gzip enabled.

清除 Cookies - 聯繫我們 - 中文偽春菜後援會 - Archiver - WAP - TOP - 界面風格