#cofacts
2026-06-02
mrorz
14:09:48
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
mrorz
23:25:32
剛才 11:22 ~ 11:23 我正在重開 DB 來套用開會時的 RAM & swap 設定
接下來就一起來觀察囉
接下來就一起來觀察囉
mrorz
23:25:32
剛才 11:22 ~ 11:23 我正在重開 DB 來套用開會時的 RAM & swap 設定
接下來就一起來觀察囉
接下來就一起來觀察囉
2026-06-03
謝宗桓
14:51:44
@az31402 has joined the channel
2026-06-09
mrorz
19:05:57
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
2026-06-12
mrorz
11:42:39
*Cloudflare 設定更新:擋商業 SEO 爬蟲 + en/ja/zh 網站快取*(6/10 晚間生效)
*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。
*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。
*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
• en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
• ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
• zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
• cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單
*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)
*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)
詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。
*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。
*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
• en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
• ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
• zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
• cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單
*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)
*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)
詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
mrorz
11:42:39
*Cloudflare 設定更新:擋商業 SEO 爬蟲 + en/ja/zh 網站快取*(6/10 晚間生效)
*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。
*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。
*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
• en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
• ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
• zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
• cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單
*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)
*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)
詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。
*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。
*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
• en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
• ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
• zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
• cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單
*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)
*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)
詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
2026-06-15
mrorz
11:07:57
ping --> cofacts discord
mrorz
11:07:57
ping --> cofacts discord
@null
11:08:25
ping from cofacts discord to g0v slack
2026-06-16
mrorz
11:02:47
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
2026-06-23
mrorz
16:09:31
今日議程 https://g0v.hackmd.io/@cofacts/meetings
之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ
不是在 g0v.hackmd.io,要在 hackmd 登入唷
之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ
不是在 g0v.hackmd.io,要在 hackmd 登入唷
mrorz
16:09:31
今日議程 https://g0v.hackmd.io/@cofacts/meetings
之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ
不是在 g0v.hackmd.io,要在 hackmd 登入唷
之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ
不是在 g0v.hackmd.io,要在 hackmd 登入唷
HackMD
# Cofacts 會議記錄 - [當週議程與紀錄](<https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ>) - [所有會議記錄](<https://github.co>