#cofacts

2026-06-02
mrorz 14:09:48
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
mrorz 23:25:32
剛才 11:22 ~ 11:23 我正在重開 DB 來套用開會時的 RAM & swap 設定
接下來就一起來觀察囉
mrorz 23:25:32
剛才 11:22 ~ 11:23 我正在重開 DB 來套用開會時的 RAM & swap 設定
接下來就一起來觀察囉
2026-06-03
謝宗桓 14:51:44
@az31402 has joined the channel
mrorz 17:59:32
中午推播之後,小聚報名人數來到 18 了 :tada:
mrorz 17:59:32
中午推播之後,小聚報名人數來到 18 了 :tada:
cofacts.kktix.cc
2 個月一次,用一個下午與 Cofacts 一起工作闢謠解惑,讓不同意見突破同溫層。 來小聚就送限量 Cofacts 貼紙。回應超過200篇,送委外設計LINE貼圖!
  • 🚀1
  • 💡1
  • 1
2026-06-09
mrorz 19:05:57
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
2026-06-12
mrorz 11:42:39
*Cloudflare 設定更新:擋商業 SEO 爬蟲 + en/ja/zh 網站快取*(6/10 晚間生效)

*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。

*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。

*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單

*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)

*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)

詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
mrorz 11:42:39
*Cloudflare 設定更新:擋商業 SEO 爬蟲 + en/ja/zh 網站快取*(6/10 晚間生效)

*改了什麼*
1. *WAF 新規則「Block 商業爬蟲」*:封鎖 DotBot (Moz)、SemrushBot、AhrefsBot、DataForSeoBot、Barkrowler、MJ12bot。這些是純商業 SEO 工具的爬蟲,每月吃掉 ~330 GB origin 流量(快取命中率 ~0%),但對 Google/Bing 搜尋排名沒有任何貢獻。
2. *新 Cache Rule「en/ja/zh SSR HTML」*:en/ja/zh.cofacts.tw 的頁面改由 Cloudflare 快取 60 秒。之前這些 SSR 頁面 100% 直接打到主機(zh 還因為舊規則的條件寫法完全沒被快取到)。

*為什麼*
GCE 的 egress 費用 $51/月,單位流量成本是 Cloud Run 的 6 倍;分析後發現大宗是 SEO 爬蟲狂抓 + HTML 完全沒快取。

*生效 36 小時的成效*(前後各 34 小時對照,打到 origin 的流量)
en.cofacts.tw:9.5 GB → 4.4 GB(*-54%*)
ja.cofacts.tw:9.2 GB → 2.8 GB(*-70%*)
zh.cofacts.tw:7.5 GB → 2.2 GB(*-71%*,快取命中率 12% → 43%)
cofacts.tw:18.5 GB → 10.8 GB(*-42%*,純粹來自擋爬蟲)
• 六隻爬蟲流量 26 GB → 36 MB(全是 403),36 小時共攔 13,823 個請求
• 估計省 *GCE egress $13–15/月 + Cloud Run $4–5/月*,正式驗收看 7 月帳單

*對使用者的影響*
• 一般使用者與 Google/Bing/搜尋排名:無影響
• en/ja/zh 頁面內容最多延遲 60 秒更新(送出回應後重整頁面可能要等一分鐘才看到)
• 被站方封鎖的使用者看到的頁面不受快取影響(有特別排除)

*後續*
• ClaudeBot(Anthropic AI 爬蟲,95 GB/月)要不要擋還在評估
• 評估把同樣的快取模式套到 cofacts.tw 的 /article/* (Googlebot 每月 91 GB 還在直打 Cloud Run)

詳細分析與規則設定記錄在 devops repo 的 Cloudflare.md(commit 7ba2439)
2026-06-15
mrorz 11:07:57
ping --> cofacts discord
mrorz 11:07:57
ping --> cofacts discord
@null 11:08:25
ping from cofacts discord to g0v slack
2026-06-16
mrorz 11:02:47
HackMD
# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2026 -
2026-06-23
mrorz 16:09:31
今日議程 https://g0v.hackmd.io/@cofacts/meetings

之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ

不是在 g0v.hackmd.io,要在 hackmd 登入唷
mrorz 16:09:31
今日議程 https://g0v.hackmd.io/@cofacts/meetings

之後當周議程都會固定用這個 hackmd 的文件 https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ

不是在 g0v.hackmd.io,要在 hackmd 登入唷
HackMD
# Cofacts 會議記錄 - [當週議程與紀錄](<https://hackmd.io/PkOtuQSqTKO_r2PcgiXKQQ>) - [所有會議記錄](<https://github.co>