#cofacts
2021-11-01
cai
18:01:26
Replied to a thread: 2021-10-31 19:54:42
補充欄的,這次還有人按讚
https://cofacts.tw/article/30shf8vja965y
https://cofacts.tw/article/1j76un2qvmzko
https://cofacts.tw/article/3h41v8fib3c1y
https://cofacts.tw/article/14gmqjd73drxo
https://cofacts.tw/article/2jubvdwmqlymd
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/30shf8vja965y
https://cofacts.tw/article/1j76un2qvmzko
https://cofacts.tw/article/3h41v8fib3c1y
https://cofacts.tw/article/14gmqjd73drxo
https://cofacts.tw/article/2jubvdwmqlymd
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
- 🙏1
nonumpa
18:03:43
@iacmai 是廣告偵測機器人嗎 XD
cai
18:06:43
`等你來答`浮出來的XD
cai
18:08:30
剛看到3Q那邊有澄清想說要不要把昨天寫的回應改掉,順便看一下`等你來答` 就發現了
mrorz
18:55:34
有人按讚超煩
2021-11-02
lucien
03:31:09
你是說從 A 文的回報者,找他所有回報文章嗎
lucien
03:32:51
如果是從回報補充說明的頭像點過去,到此回報者的文章列表這樣設計應該是可以的
lucien
03:33:21
問題可能是同回報者的文章列表,有沒有現成 UI componet 直接兜一下
mrorz
13:01:17
已經把這些補充欄的作者補進 spreadsheet 了
感謝回報 m(_ _)m
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
感謝回報 m(_ _)m
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
cai
13:09:22
又有新的
https://cofacts.tw/article/35s3oqkdq8qys
https://cofacts.tw/article/1cxozq9qv0419
https://cofacts.tw/article/2oohq47wv9043
https://cofacts.tw/article/5480703300823-rumor
變體來了,丟連結然後叫人連結文章的留言區,結果又跟之前一樣加賴 😆
丟帳號google得到一個律師名字跟律師證號,網頁點進去查無資料
再丟去律師查詢系統 名字查無資料,證號根本不同人
這堆要人加*賴*
https://cofacts.tw/article/35s3oqkdq8qys
https://cofacts.tw/article/1cxozq9qv0419
https://cofacts.tw/article/2oohq47wv9043
https://cofacts.tw/article/5480703300823-rumor
變體來了,丟連結然後叫人連結文章的留言區,結果又跟之前一樣加賴 😆
丟帳號google得到一個律師名字跟律師證號,網頁點進去查無資料
再丟去律師查詢系統 名字查無資料,證號根本不同人
這堆要人加*賴*
cai
13:32:01
又有新的,都同一位,太多篇懶得翻了
https://cofacts.tw/article/35s3oqkdq8qys
https://cofacts.tw/article/1cxozq9qv0419
https://cofacts.tw/article/2oohq47wv9043
https://cofacts.tw/article/5drsegt3owa8
https://cofacts.tw/article/1nlqbb03g7pit
變體
https://cofacts.tw/article/5480703300823-rumor
丟連結然後叫人連結文章的留言區,結果又跟之前一樣加賴 😆
丟帳號google得到一個律師名字跟律師證號
https://i.imgur.com/W45mZAK.png
https://www.law110.com.tw/forum_content.aspx?pid=1364230 點個人進去查無資料
再丟去律師查詢系統 名字查無資料,證號根本不同人
https://cofacts.tw/article/35s3oqkdq8qys
https://cofacts.tw/article/1cxozq9qv0419
https://cofacts.tw/article/2oohq47wv9043
https://cofacts.tw/article/5drsegt3owa8
https://cofacts.tw/article/1nlqbb03g7pit
變體
https://cofacts.tw/article/5480703300823-rumor
丟連結然後叫人連結文章的留言區,結果又跟之前一樣加賴 😆
丟帳號google得到一個律師名字跟律師證號
https://i.imgur.com/W45mZAK.png
https://www.law110.com.tw/forum_content.aspx?pid=1364230 點個人進去查無資料
再丟去律師查詢系統 名字查無資料,證號根本不同人
mrorz
14:25:33
spreadsheet 又有新人進帳了~
這些廣告真的很詭異囧
這些廣告真的很詭異囧
2021-11-03
cai
17:52:01
Replied to a thread: 2021-10-31 19:54:42
今天可疑訊息又浮上來許多串,放幾則比較多人的包含之前沒抓到的帳號
https://cofacts.tw/article/2sx0dkbklsewg
https://cofacts.tw/article/wo41wy34iome
https://cofacts.tw/article/AWBeXfPdyCdS-nWhulL4
https://cofacts.tw/article/8c8q4judx7ie
https://cofacts.tw/article/5hg4nki96uff
https://cofacts.tw/article/kk2d56p3jtw5
https://cofacts.tw/article/1p74sayw2tcye
他是直接搜尋詐騙然後每則複製貼上嗎= =
https://cofacts.tw/article/2sx0dkbklsewg
https://cofacts.tw/article/wo41wy34iome
https://cofacts.tw/article/AWBeXfPdyCdS-nWhulL4
https://cofacts.tw/article/8c8q4judx7ie
https://cofacts.tw/article/5hg4nki96uff
https://cofacts.tw/article/kk2d56p3jtw5
https://cofacts.tw/article/1p74sayw2tcye
他是直接搜尋詐騙然後每則複製貼上嗎= =
- 😮1
2021-11-04
Galaxian85
15:46:45
@gasbomb_tw has joined the channel
2021-11-05
cai
21:41:48
新人~~ 一樣是舊串浮出發現
https://cofacts.tw/article/3ojnst2jfbbgi
可以推測是 https://cofacts.tw/search?type=messages&q=詐騙 去每篇留
看到就倒讚方便辨認新人
https://cofacts.tw/article/3ojnst2jfbbgi
可以推測是 https://cofacts.tw/search?type=messages&q=詐騙 去每篇留
看到就倒讚方便辨認新人
2021-11-06
cai
17:28:36
https://cofacts.tw/article/AV__-TGbyCdS-nWhuj2z
又一個新的,好像可以開個專文來研究😆
又一個新的,好像可以開個專文來研究😆
2021-11-07
cai
22:21:17
這種出現奇怪文字的,是因為簡繁轉換問題?
https://cofacts.tw/article/1xz3asol7tt1x
https://cofacts.tw/article/8q5q2dqzs1eo
https://cofacts.tw/article/1xz3asol7tt1x
https://cofacts.tw/article/8q5q2dqzs1eo
nonumpa
2021-11-08 09:00:51
第二個我猜是 LINE 的 OCR,辨識不出來就會亂碼,有些字則是很明顯辨識成長得很像的
查了一下文字來源應該是 Facebook 的爆料公社,使用情境應該是某些版本的 Facebook 文章不能複製,截圖用 OCR 吧
查了一下文字來源應該是 Facebook 的爆料公社,使用情境應該是某些版本的 Facebook 文章不能複製,截圖用 OCR 吧
2021-11-08
nonumpa
09:00:51
第二個我猜是 LINE 的 OCR,辨識不出來就會亂碼,有些字則是很明顯辨識成長得很像的
查了一下文字來源應該是 Facebook 的爆料公社,使用情境應該是某些版本的 Facebook 文章不能複製,截圖用 OCR 吧
查了一下文字來源應該是 Facebook 的爆料公社,使用情境應該是某些版本的 Facebook 文章不能複製,截圖用 OCR 吧
2021-11-09
antonio.argote
23:43:42
@antonio.argote has joined the channel
2021-11-10
mrorz
11:12:49
今日會議紀錄
今天稍微晚一點點,21:00 開始唷
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FhEaUz91PR0mFftzDfydg8A
今天稍微晚一點點,21:00 開始唷
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FhEaUz91PR0mFftzDfydg8A
HackMD
# Cofacts 會議記錄 ## 2021 - [20211110 會議記錄](/hEaUz91PR0mFftzDfydg8A) - [20211103 會議記錄](/1WADYBY0TH27
Mamie_c4jpn
11:48:43
@mami.takesada has joined the channel
github2
20:20:12
Update test/rumors-db after rumors-db's release <https://github.com/cofacts/rumors-db/releases/tag/release%2F20211105|https://github.com/cofacts/rumors-db/releases/tag/release%2F20211105> Will merge after build pass.
github2
20:27:18
<https://coveralls.io/builds/44160070|Coverage Status> Coverage decreased (-0.1%) to 86.193% when pulling *<https://github.com/cofacts/rumors-api/commit/c7aa10fbf133a55899faf8cdcc9363a1d3ba8a37|c7aa10f> on update-rumors-db* into *<https://github.com/cofacts/rumors-api/commit/a01c249da506bef52cb909d24759918b9a01ebfe|a01c249> on master*.
2021-11-11
github2
00:25:18
<https://g0v.hackmd.io/hEaUz91PR0mFftzDfydg8A#Spammers|https://g0v.hackmd.io/hEaUz91PR0mFftzDfydg8A#Spammers>
mrorz
08:35:20
Replied to a thread: 2021-10-31 19:54:42
那個搜尋結果第一篇非常驚人!
現在我們的列表裡面有三位「建志」、兩位「郭子源」惹
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
現在我們的列表裡面有三位「建志」、兩位「郭子源」惹
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
mrorz
08:36:50
Ohhh 那個郭子源就是之前 @iacmai google 到的「律師」耶
cai
10:40:28
因為部長唱歌影片這串一個晚上變形太多,筆記部長影片這串`謠言變形` 😅
昨天晚上就有澄清新聞,但詳細版的大概今天才有
昨天晚上就有澄清新聞,但詳細版的大概今天才有
第一個影片系列,目前看到14個
https://cofacts.tw/article/2a9bha29ca7vv
https://cofacts.tw/article/3dl5tp6iubtqp
https://cofacts.tw/article/1i6m72dy5orsz
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ozoyuiozn5sg
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ttb7zmccicxn
https://cofacts.tw/article/mhs03q8ps8xi
https://cofacts.tw/article/70bc126l4t61
https://cofacts.tw/article/17qepbjw8auiy
https://cofacts.tw/article/9bpn9z4kb2jk
https://cofacts.tw/article/2dx6p2te67p90
https://cofacts.tw/article/2nrjjmrgnyucd
https://cofacts.tw/article/2eq67xw6qttrz
https://cofacts.tw/article/2a9bha29ca7vv
https://cofacts.tw/article/3dl5tp6iubtqp
https://cofacts.tw/article/1i6m72dy5orsz
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ozoyuiozn5sg
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ttb7zmccicxn
https://cofacts.tw/article/mhs03q8ps8xi
https://cofacts.tw/article/70bc126l4t61
https://cofacts.tw/article/17qepbjw8auiy
https://cofacts.tw/article/9bpn9z4kb2jk
https://cofacts.tw/article/2dx6p2te67p90
https://cofacts.tw/article/2nrjjmrgnyucd
https://cofacts.tw/article/2eq67xw6qttrz
還有加別的事件的變形
https://cofacts.tw/article/1kogt7pdl6ri4
https://cofacts.tw/article/1kogt7pdl6ri4
cai
12:41:03
第一個影片系列,目前看到14個
https://cofacts.tw/article/2a9bha29ca7vv
https://cofacts.tw/article/3dl5tp6iubtqp
https://cofacts.tw/article/1i6m72dy5orsz
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ozoyuiozn5sg
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ttb7zmccicxn
https://cofacts.tw/article/mhs03q8ps8xi
https://cofacts.tw/article/70bc126l4t61
https://cofacts.tw/article/17qepbjw8auiy
https://cofacts.tw/article/9bpn9z4kb2jk
https://cofacts.tw/article/2dx6p2te67p90
https://cofacts.tw/article/2nrjjmrgnyucd
https://cofacts.tw/article/2eq67xw6qttrz
https://cofacts.tw/article/2a9bha29ca7vv
https://cofacts.tw/article/3dl5tp6iubtqp
https://cofacts.tw/article/1i6m72dy5orsz
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ozoyuiozn5sg
https://cofacts.tw/article/2trt4gvu8gzpz
https://cofacts.tw/article/2ttb7zmccicxn
https://cofacts.tw/article/mhs03q8ps8xi
https://cofacts.tw/article/70bc126l4t61
https://cofacts.tw/article/17qepbjw8auiy
https://cofacts.tw/article/9bpn9z4kb2jk
https://cofacts.tw/article/2dx6p2te67p90
https://cofacts.tw/article/2nrjjmrgnyucd
https://cofacts.tw/article/2eq67xw6qttrz
minexo79
19:28:23
@minexo79 has left the channel
2021-11-12
cai
11:46:39
還有加別的事件的變形
https://cofacts.tw/article/1kogt7pdl6ri4
https://cofacts.tw/article/1kogt7pdl6ri4
2021-11-14
2021-11-15
mrorz
02:17:38
@kidstarkenny 請加「Cofacts 真的假的 | 轉傳查證」唷
mrorz
16:09:09
今天 API 比較常出現 timeout 的問題,LINE bot 與網站都慢慢的
我發現
1. 過去 averag 700~900 request/min 的 API server 現在是 1.1K request/min, peak 是 1.7k,所以 API 變忙了
2. 有 252.7 requests/min 是浪費在 `IntrospectionQuery` ,且其與 GraphQL operation `getArticles` 的 rpm 相同,看起來像是有人寫了 `getArticles` query 但卻每次都打 `IntrospectionQuery`
3. 其他 highest request rate 的 operation 看起來都是 rumors-site 的 request 較多
我發現
1. 過去 averag 700~900 request/min 的 API server 現在是 1.1K request/min, peak 是 1.7k,所以 API 變忙了
2. 有 252.7 requests/min 是浪費在 `IntrospectionQuery` ,且其與 GraphQL operation `getArticles` 的 rpm 相同,看起來像是有人寫了 `getArticles` query 但卻每次都打 `IntrospectionQuery`
3. 其他 highest request rate 的 operation 看起來都是 rumors-site 的 request 較多
- 🤔1
mrorz
2021-11-15 16:18:07
如果這個狀況持續的話,我會考慮升級 linode 成 160USD/mo,32GB RAM 的版本(Shared CPU PLans)
https://www.linode.com/pricing/
https://www.linode.com/pricing/
mrorz
2021-11-15 16:46:48
跟 6 月相比,現在的 loading 屬於正常
6 月時截圖
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FMhHehw-oQ2OqTVWFUxNRfA
6 月時截圖
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FMhHehw-oQ2OqTVWFUxNRfA
mrorz
2021-11-15 16:49:18
看起來都很正常,不知道為啥會這麼慢
mrorz
2021-11-15 16:52:17
SSH 進去 restart API --> 跑 GetArticle,需要 5s
restart DB --> 跑 GetArticle,好像有變快?
restart DB --> 跑 GetArticle,好像有變快?
mrorz
2021-11-15 16:54:24
API 與 DB 的 Log 都沒發現有啥異狀⋯⋯
kelvinho84
2021-11-15 17:13:41
disable the introspection ?
mrorz
2021-11-15 19:42:22
我也在想要不要 disable
雖然其實我自己也很常用 GraphQL playground,一 disable introspection 就會變很難用(掩面)
雖然其實我自己也很常用 GraphQL playground,一 disable introspection 就會變很難用(掩面)
mrorz
16:18:07
如果這個狀況持續的話,我會考慮升級 linode 成 160USD/mo,32GB RAM 的版本(Shared CPU PLans)
https://www.linode.com/pricing/
https://www.linode.com/pricing/
mrorz
16:46:48
跟 6 月相比,現在的 loading 屬於正常
6 月時截圖
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FMhHehw-oQ2OqTVWFUxNRfA
6 月時截圖
https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FMhHehw-oQ2OqTVWFUxNRfA
mrorz
16:49:18
看起來都很正常,不知道為啥會這麼慢
mrorz
16:52:17
SSH 進去 restart API --> 跑 GetArticle,需要 5s
restart DB --> 跑 GetArticle,好像有變快?
restart DB --> 跑 GetArticle,好像有變快?
mrorz
16:54:24
API 與 DB 的 Log 都沒發現有啥異狀⋯⋯
kelvinho84
17:13:41
disable the introspection ?
mrorz
19:42:22
我也在想要不要 disable
雖然其實我自己也很常用 GraphQL playground,一 disable introspection 就會變很難用(掩面)
雖然其實我自己也很常用 GraphQL playground,一 disable introspection 就會變很難用(掩面)
2021-11-16
mrorz
13:04:07
【AI category classifier 訓練資料生成討論】cc/ @ggm @darkbtf @gary96302000.eecs96
隨著公投接近,我想要宣傳讓大家用「主題」+ RSS 訂閱追蹤特定主題。但在這之前,我想要先把之前沒有建立的、使用者對 category 的 feedback 更新 AI model 這件事情做好。
過去 2 週開會時與 @ggm 討論過後,我想要 propose 下面這個機制,用來 review 餵給 rumors-ai-bert 的 ground truth:
https://g0v.hackmd.io/EcrdwfZrQOSTGX7yK6nn4w?view
整個機制流程是:
1. 執行 Script 1,給定一個時間點,把該時間點之後符合規則的 article category 產出 xlsx 讓我們手動上傳到 google sheet 進行人工 review(例檔)
2. 人工 review:在 sheet 上決定是否要 adopt 該 article category
3. 執行 Script 2,給定此 google sheet,產出要餵給 AI 的 JSON 檔案(格式見 design doc)
想請大家看看這個流程有沒有漏掉什麼~
隨著公投接近,我想要宣傳讓大家用「主題」+ RSS 訂閱追蹤特定主題。但在這之前,我想要先把之前沒有建立的、使用者對 category 的 feedback 更新 AI model 這件事情做好。
過去 2 週開會時與 @ggm 討論過後,我想要 propose 下面這個機制,用來 review 餵給 rumors-ai-bert 的 ground truth:
https://g0v.hackmd.io/EcrdwfZrQOSTGX7yK6nn4w?view
整個機制流程是:
1. 執行 Script 1,給定一個時間點,把該時間點之後符合規則的 article category 產出 xlsx 讓我們手動上傳到 google sheet 進行人工 review(例檔)
2. 人工 review:在 sheet 上決定是否要 adopt 該 article category
3. 執行 Script 2,給定此 google sheet,產出要餵給 AI 的 JSON 檔案(格式見 design doc)
想請大家看看這個流程有沒有漏掉什麼~
- 🤔1
mrorz
2021-11-16 13:38:59
我覺得需要 review 的有幾點:
1. Ground truth 的基準 = 該 article-category 連結的評價,正面大於負面
2. 我們進行的人工 Review 與網友在 cofacts 網站上面對 article-category 的評價權重相同(都是 +1 或 -1)
3. 對 AI 標記與人工標記的差別待遇(AI 標記要先有網友給予正評,才會納入 review;人工標記會直接納入 review)
1. Ground truth 的基準 = 該 article-category 連結的評價,正面大於負面
2. 我們進行的人工 Review 與網友在 cofacts 網站上面對 article-category 的評價權重相同(都是 +1 或 -1)
3. 對 AI 標記與人工標記的差別待遇(AI 標記要先有網友給予正評,才會納入 review;人工標記會直接納入 review)
mrorz
2021-11-16 13:39:45
另外需要 @ggm 提供若水的 ground truth,我們應該會需要另外一個 script 把若水的 label 寫成 article-category 並且自動給予正評
https://github.com/cofacts/ground-truth 我先開了一個放這裡,之後可能可以一批一批的整理過來?這個 repo 裡面的 `20200324_14908.zip` 就是之前若水標的那批
mrorz
13:38:59
我覺得需要 review 的有幾點:
1. Ground truth 的基準 = 該 article-category 連結的評價,正面大於負面
2. 我們進行的人工 Review 與網友在 cofacts 網站上面對 article-category 的評價權重相同(都是 +1 或 -1)
3. 對 AI 標記與人工標記的差別待遇(AI 標記要先有網友給予正評,才會納入 review;人工標記會直接納入 review)
1. Ground truth 的基準 = 該 article-category 連結的評價,正面大於負面
2. 我們進行的人工 Review 與網友在 cofacts 網站上面對 article-category 的評價權重相同(都是 +1 或 -1)
3. 對 AI 標記與人工標記的差別待遇(AI 標記要先有網友給予正評,才會納入 review;人工標記會直接納入 review)
mrorz
13:39:45
另外需要 @ggm 提供若水的 ground truth,我們應該會需要另外一個 script 把若水的 label 寫成 article-category 並且自動給予正評
Denny George
14:46:58
@denny.george90 has joined the channel
2021-11-17
mrorz
13:49:25
今日議程: https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2FlYTN-n1xQyqlHB9oeaPvuQ
會同時在 Workis 與 Gather 進行ㄛ
現場參加者會有伴手禮可以吃 XD
會同時在 Workis 與 Gather 進行ㄛ
現場參加者會有伴手禮可以吃 XD
cai
19:42:11
已被刪除的回應(例如:廣告留言)在`使用現有回應`功能時會出現,之後實作廣告留言時可能要注意這點
https://cofacts.tw/article/2xlk65b6939gu
https://cofacts.tw/article/2xlk65b6939gu
- 👍1
mrorz
2021-11-17 20:57:12
cai
19:56:50
規則好像有變,用詐騙搜尋第一則這兩週看會不准
似乎改找搜尋結果在N個月內的回應?[ 待確認 ]
似乎改找搜尋結果在N個月內的回應?[ 待確認 ]
github2
20:56:34
Discussion in slack: <https://user-images.githubusercontent.com/108608/142204449-94fbb4c1-cd72-4a79-8546-66f4a5c80351.png|圖片> "Use existing reply" will now list out deleted replies. Although we cannot filter out replies from API (because `articleReplies` are not stored in reply), we can remove replies with no normal article replies when listing them out in UI.![]()
mrorz
20:57:12
2021-11-19
Yenlee
09:36:09
@yenlee789 has joined the channel
mrorz
12:59:42
Cofacts 現在負載不正常
mrorz
2021-11-19 13:24:03
我開啟了 cloudflare under attack 模式
mrorz
2021-11-19 13:25:59
發現 under attack 會讓 API 壞掉⋯⋯只好重新打開
lucien
2021-11-19 13:33:53
看來是想要 injection 呢
mrorz
2021-11-19 13:35:14
Request 數量也不少
lucien
2021-11-19 13:36:12
168.158.119.0/24, 103.22.201.0/24 先擋掉如何
mrorz
2021-11-19 13:41:03
這是 nginx log, 前面是 cloudflare
那兩個 IP 是 cloudflare ㄅ
那兩個 IP 是 cloudflare ㄅ
mrorz
2021-11-19 13:47:09
load 回升到 10 哎
mrorz
2021-11-19 13:54:50
mrorz
2021-11-19 14:13:27
在 cloudflare 上 block `116.204.211.21` 之後 API 的 spam 也消失了
看起來是來自單一主機的攻擊
看起來是來自單一主機的攻擊
kelvinho84
2021-11-19 14:16:37
can ur nginx set rate limit to block it?
mrorz
2021-11-19 14:17:55
剛才不小心把 chatbot 也擋住 x_x
mrorz
2021-11-19 14:50:17
Cloudflare 顯示對方最後一次 request 在 14:42:19 看起來是停下來了
cai
13:17:32
我在想是不是跟廣告留言有關,剛看了一下又有一堆新的。他們是怎樣做到短時間留多篇,爬蟲嗎?
mrorz
2021-11-19 13:27:10
請問是哪一篇呢
可疑訊息那邊浮上來有撈到的,大概這樣
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/2oeg0qh8d8occ
https://cofacts.tw/article/k6awjv37ysw2
https://cofacts.tw/article/2b19xixqk4tdg
https://cofacts.tw/article/1loth4bxhkg6x
https://cofacts.tw/article/t1vjcp0fvbh5
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/2oeg0qh8d8occ
https://cofacts.tw/article/k6awjv37ysw2
https://cofacts.tw/article/2b19xixqk4tdg
https://cofacts.tw/article/1loth4bxhkg6x
https://cofacts.tw/article/t1vjcp0fvbh5
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/2yyfxcy3uehc3
我有用 cofacts.tw/search?type=messages&q=詐騙&start=now-1M%2Fd 去查,就沒有每篇都有
mrorz
2021-11-19 14:20:52
感謝感謝
我晚點看看有沒有新的帳號要水桶
我晚點看看有沒有新的帳號要水桶
mrorz
2021-11-19 21:22:59
https://www.twreporter.org/a/online-scams-fraud-tool-insiders 所以這種到公開管道拉人到私密群組行騙的,是「引流」產業的人
https://cofacts.tw/article/2uzct04zb11zd
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/1r0wcyrtc2p9g
https://cofacts.tw/article/2n6l3h8m8612t
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/32g75r0s2jpvu
https://cofacts.tw/article/2iapjcy4kn8dj
https://cofacts.tw/article/2t0viakt6orjg
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/1r0wcyrtc2p9g
https://cofacts.tw/article/2n6l3h8m8612t
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/32g75r0s2jpvu
https://cofacts.tw/article/2iapjcy4kn8dj
https://cofacts.tw/article/2t0viakt6orjg
mrorz
2021-11-25 13:34:13
感謝 @iacmai ,以上文章內的所有 reply request 的 user id 都收錄到這裡囉!
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
幾個觀察
• 22 個 spammer 裡面,cai 回報中常出現的約為 5 人左右,會一直重複使用現有帳號,未來封鎖是有效益的(對我們來說僅是一次性的公告與刪除,但卻可以 cancel 未來該 spammer 所有的 effort)。
• 現有 spammer 會更換廣告字詞與所廣告的 LINE ID。網站目前不會顯示 comment 的 user name 所以會讓人誤以為有新人,但其實是同一個 Cofacts user 所為。
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
幾個觀察
• 22 個 spammer 裡面,cai 回報中常出現的約為 5 人左右,會一直重複使用現有帳號,未來封鎖是有效益的(對我們來說僅是一次性的公告與刪除,但卻可以 cancel 未來該 spammer 所有的 effort)。
• 現有 spammer 會更換廣告字詞與所廣告的 LINE ID。網站目前不會顯示 comment 的 user name 所以會讓人誤以為有新人,但其實是同一個 Cofacts user 所為。
mrorz
13:24:03
我開啟了 cloudflare under attack 模式
mrorz
13:25:59
發現 under attack 會讓 API 壞掉⋯⋯只好重新打開
mrorz
13:27:10
請問是哪一篇呢
cai
13:32:16
lucien
13:33:53
看來是想要 injection 呢
mrorz
13:35:14
Request 數量也不少
lucien
13:36:12
168.158.119.0/24, 103.22.201.0/24 先擋掉如何
mrorz
13:41:03
這是 nginx log, 前面是 cloudflare
那兩個 IP 是 cloudflare ㄅ
那兩個 IP 是 cloudflare ㄅ
cai
13:41:36
可疑訊息那邊浮上來有撈到的,大概這樣
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/2oeg0qh8d8occ
https://cofacts.tw/article/k6awjv37ysw2
https://cofacts.tw/article/2b19xixqk4tdg
https://cofacts.tw/article/1loth4bxhkg6x
https://cofacts.tw/article/t1vjcp0fvbh5
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/2oeg0qh8d8occ
https://cofacts.tw/article/k6awjv37ysw2
https://cofacts.tw/article/2b19xixqk4tdg
https://cofacts.tw/article/1loth4bxhkg6x
https://cofacts.tw/article/t1vjcp0fvbh5
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/2yyfxcy3uehc3
cai
13:42:20
我有用 cofacts.tw/search?type=messages&q=詐騙&start=now-1M%2Fd 去查,就沒有每篇都有
mrorz
13:47:09
load 回升到 10 哎
mrorz
13:54:50
Replied to a thread: 2021-11-19 12:59:42
mrorz
14:13:27
Replied to a thread: 2021-11-19 12:59:42
在 cloudflare 上 block `116.204.211.21` 之後 API 的 spam 也消失了
看起來是來自單一主機的攻擊
看起來是來自單一主機的攻擊
kelvinho84
14:16:37
can ur nginx set rate limit to block it?
mrorz
14:17:55
剛才不小心把 chatbot 也擋住 x_x
mrorz
14:20:52
感謝感謝
我晚點看看有沒有新的帳號要水桶
我晚點看看有沒有新的帳號要水桶
mrorz
14:50:17
Cloudflare 顯示對方最後一次 request 在 14:42:19 看起來是停下來了
mrorz
21:22:59
https://www.twreporter.org/a/online-scams-fraud-tool-insiders 所以這種到公開管道拉人到私密群組行騙的,是「引流」產業的人
2021-11-20
2021-11-21
ggm
16:13:06
Replied to a thread: 2021-11-16 13:04:07
https://github.com/cofacts/ground-truth 我先開了一個放這裡,之後可能可以一批一批的整理過來?這個 repo 裡面的 `20200324_14908.zip` 就是之前若水標的那批
- 🙏1
2021-11-22
cai
21:45:12
2021-11-23
cai
13:05:01
https://cofacts.tw/article/2uzct04zb11zd
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/1r0wcyrtc2p9g
https://cofacts.tw/article/2n6l3h8m8612t
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/32g75r0s2jpvu
https://cofacts.tw/article/2iapjcy4kn8dj
https://cofacts.tw/article/2t0viakt6orjg
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/1phzom9cz94we
https://cofacts.tw/article/2yyfxcy3uehc3
https://cofacts.tw/article/3j65nbsuo6eqb
https://cofacts.tw/article/2v3ezprn0kc2w
https://cofacts.tw/article/1r0wcyrtc2p9g
https://cofacts.tw/article/2n6l3h8m8612t
https://cofacts.tw/article/1ojxjzxk8lcms
https://cofacts.tw/article/19i23tu9cxs8x
https://cofacts.tw/article/35hiwsughxw9j
https://cofacts.tw/article/396z8wjkdk4kz
https://cofacts.tw/article/l5zzn77p6078
https://cofacts.tw/article/32g75r0s2jpvu
https://cofacts.tw/article/2iapjcy4kn8dj
https://cofacts.tw/article/2t0viakt6orjg
cai
19:36:22
https://cofacts.tw/article/1ambr7sq4vkge 這篇是詐騙但是有個資怎麼辦 🤔
https://youtu.be/EiVWlzHJYVY 直接把流程都丟出來了XD
可以隱去個資唷
mrorz
2021-11-24 10:55:47
個資好像是名字的部分,代換成空白應該 OK?
還有身分證字號、地址
cai
19:37:33
https://youtu.be/EiVWlzHJYVY 直接把流程都丟出來了XD
2021-11-24
bil
00:19:38
可以隱去個資唷
mrorz
10:55:47
個資好像是名字的部分,代換成空白應該 OK?
cai
11:29:45
還有身分證字號、地址
mrorz
17:33:34
HackMD
# Cofacts 會議記錄 ## 2021 - [20211124 會議記錄](/YaQbzua8SWmkm2DNSGD-eQ) - [20211117 會議記錄](/lYTN-n1xQyql
mrorz
2021-11-24 19:54:57
我們先吃飯唷
大概晚 10 分鐘
大概晚 10 分鐘
mrorz
19:54:57
我們先吃飯唷
大概晚 10 分鐘
大概晚 10 分鐘
2021-11-25
mrorz
13:34:13
Replied to a thread: 2021-11-19 13:17:32
感謝 @iacmai ,以上文章內的所有 reply request 的 user id 都收錄到這裡囉!
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
幾個觀察
• 22 個 spammer 裡面,cai 回報中常出現的約為 5 人左右,會一直重複使用現有帳號,未來封鎖是有效益的(對我們來說僅是一次性的公告與刪除,但卻可以 cancel 未來該 spammer 所有的 effort)。
• 現有 spammer 會更換廣告字詞與所廣告的 LINE ID。網站目前不會顯示 comment 的 user name 所以會讓人誤以為有新人,但其實是同一個 Cofacts user 所為。
https://docs.google.com/spreadsheets/d/1Ytd69YU6z7Fgra81_79XrsPwQYV1Clh0yp5OZlk5Psg/edit#gid=0
幾個觀察
• 22 個 spammer 裡面,cai 回報中常出現的約為 5 人左右,會一直重複使用現有帳號,未來封鎖是有效益的(對我們來說僅是一次性的公告與刪除,但卻可以 cancel 未來該 spammer 所有的 effort)。
• 現有 spammer 會更換廣告字詞與所廣告的 LINE ID。網站目前不會顯示 comment 的 user name 所以會讓人誤以為有新人,但其實是同一個 Cofacts user 所為。
github2
14:07:21
mrorz
2021-11-25 14:10:27
今天我們更新了詐騙使用者的 ID 列表以及其行騙內文,也準備了執行隱藏作業的公告,請大家過目看看有沒有問題唷!
https://github.com/cofacts/takedowns/pull/24/files?short_path=40fc26f#diff-40fc26ff668aecd960f64a62fb77138112fe8b17ade8fde941f1884681f15e39
沒有問題的話,明日凌晨就可以把這些使用者標記成 spammer。雖然「隱藏」的部分還沒實作完成,但有了標記之後,這些 spammer 貼新的 comment 就不會增加回報次數、也不會把舊文章頂到文章列表的前面來唷。
https://github.com/cofacts/takedowns/pull/24/files?short_path=40fc26f#diff-40fc26ff668aecd960f64a62fb77138112fe8b17ade8fde941f1884681f15e39
沒有問題的話,明日凌晨就可以把這些使用者標記成 spammer。雖然「隱藏」的部分還沒實作完成,但有了標記之後,這些 spammer 貼新的 comment 就不會增加回報次數、也不會把舊文章頂到文章列表的前面來唷。
mrorz
2021-11-25 15:12:40
沒有問題的話可以 approve PR 的人也請幫忙 approve 那則公告,這樣我凌晨處理的時候才有 public URL 可以填 🙏
mrorz
14:10:27
Replied to a thread: 2021-11-25 14:07:21
今天我們更新了詐騙使用者的 ID 列表以及其行騙內文,也準備了執行隱藏作業的公告,請大家過目看看有沒有問題唷!
https://github.com/cofacts/takedowns/pull/24/files?short_path=40fc26f#diff-40fc26ff668aecd960f64a62fb77138112fe8b17ade8fde941f1884681f15e39
沒有問題的話,明日凌晨就可以把這些使用者標記成 spammer。雖然「隱藏」的部分還沒實作完成,但有了標記之後,這些 spammer 貼新的 comment 就不會增加回報次數、也不會把舊文章頂到文章列表的前面來唷。
https://github.com/cofacts/takedowns/pull/24/files?short_path=40fc26f#diff-40fc26ff668aecd960f64a62fb77138112fe8b17ade8fde941f1884681f15e39
沒有問題的話,明日凌晨就可以把這些使用者標記成 spammer。雖然「隱藏」的部分還沒實作完成,但有了標記之後,這些 spammer 貼新的 comment 就不會增加回報次數、也不會把舊文章頂到文章列表的前面來唷。
mrorz
15:12:40
沒有問題的話可以 approve PR 的人也請幫忙 approve 那則公告,這樣我凌晨處理的時候才有 public URL 可以填 🙏
cai
17:57:56
昨天講的刷tag 問題,稍微觀察後發現不只`中國影響力` 其他tag也有標錯問題。
推測是新手編輯的原因是本週才頻繁出現。
可能要在分類描述上寫更具體,或者另外寫教學文
舉例: https://cofacts.tw/article/2pqwcnpap35z7
被多列了`免費訊息詐騙`、`連署`、`中國影響力`
(先放著沒按反對)
推測是新手編輯的原因是本週才頻繁出現。
可能要在分類描述上寫更具體,或者另外寫教學文
舉例: https://cofacts.tw/article/2pqwcnpap35z7
被多列了`免費訊息詐騙`、`連署`、`中國影響力`
(先放著沒按反對)
- 👍1
mrorz
2021-11-25 18:14:40
啊手癢按了一個反對 XD
mrorz
18:14:40
啊手癢按了一個反對 XD
mrorz
23:08:18
舊的文字換新的影片亂傳,然後被抓到 XD
https://news.pts.org.tw/article/555737
之前相同文字配的影片:https://www.mygopen.com/2021/11/Weiwuying.html
https://news.pts.org.tw/article/555737
之前相同文字配的影片:https://www.mygopen.com/2021/11/Weiwuying.html
- 👀1
2021-11-26
mrorz
01:53:39
Replied to a thread: 2021-11-26 01:40:46
已經把公告過的使用者標記為 blocked 了
希望未來這幾天文章列表會暫時不會被這些廣告戳上來 XD
希望未來這幾天文章列表會暫時不會被這些廣告戳上來 XD
- 🌸1
- 1
2021-11-27
cai
16:36:06
Replied to a thread: 2021-09-29 21:45:30
外送茶又出現了
https://cofacts.tw/article/1stu2lv8ktt8z
https://cofacts.tw/article/4bxcre2gw22r
https://cofacts.tw/article/2hliscsstl4cy
https://cofacts.tw/article/3nuu7eyqtjm2x
https://cofacts.tw/article/26996k7bgdui
https://cofacts.tw/article/1six3fmk5q1z7
https://cofacts.tw/article/c5g5ycwgipa6
https://cofacts.tw/article/r56l1j4e71cg
https://cofacts.tw/article/26ir4ewlbylgx
https://cofacts.tw/article/1stu2lv8ktt8z
https://cofacts.tw/article/4bxcre2gw22r
https://cofacts.tw/article/2hliscsstl4cy
https://cofacts.tw/article/3nuu7eyqtjm2x
https://cofacts.tw/article/26996k7bgdui
https://cofacts.tw/article/1six3fmk5q1z7
https://cofacts.tw/article/c5g5ycwgipa6
https://cofacts.tw/article/r56l1j4e71cg
https://cofacts.tw/article/26ir4ewlbylgx
- 🆗1
2021-11-28
2021-11-29
Sunny Fang
12:02:40
@yusfan21 has joined the channel
Tarunima P
12:53:37
@tarunima has joined the channel
github2
13:58:07
Corresponds to <https://g0v.hackmd.io/rf0A7MRfTOC613QZmFehQA#2nd-milestone-blocking-mechanism|2nd milestone> in user blocking mechanism • Adds `blockedReason` field to `User` object type • Necessary for website to determine if we should block an user • `ListBlockedUsers` API • So that we can list all blocked user & their blocked contents in milestone 3
github2
14:00:26
<https://coveralls.io/builds/44589306|Coverage Status> Coverage increased (+0.06%) to 86.19% when pulling *<https://github.com/cofacts/rumors-api/commit/6a82a9d4329d38de2ba89782d274016d9ea12b34|6a82a9d> on blocked-user* into *<https://github.com/cofacts/rumors-api/commit/4719a8afebe0b846876b8deabe44dd50916f8afa|4719a8a> on master*.
mrorz
14:57:44
外送茶掰掰
cai
22:52:26
撐不到一週又浮上來了
https://cofacts.tw/article/2pqwcnpap35z7
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/2lj7edudxu6ok
https://cofacts.tw/article/2wyz4b01wavbb
https://cofacts.tw/article/2tmu5bw0bkptb
https://cofacts.tw/article/19syxai4k8qxr
https://cofacts.tw/article/289edfs8jea4g
https://cofacts.tw/article/2pqwcnpap35z7
https://cofacts.tw/article/1ngy3b0dsmcap
https://cofacts.tw/article/2lj7edudxu6ok
https://cofacts.tw/article/2wyz4b01wavbb
https://cofacts.tw/article/2tmu5bw0bkptb
https://cofacts.tw/article/19syxai4k8qxr
https://cofacts.tw/article/289edfs8jea4g
1- 🆗1
2021-11-30
mrorz
00:26:45
看起來應該不會有人傳訊息進來 match 到這篇 XD
希望不會影響問其他訊息的人
希望不會影響問其他訊息的人
cai
00:30:22
地址都有,可以丟給台中市警察局了(誤)
github2
00:39:55
This is part of <https://g0v.hackmd.io/@mrorz/cofacts-meeting-notes/%2Frf0A7MRfTOC613QZmFehQA|the 2nd milestone> of user blocking mechanism. • Loads `blockedReason` in `AppLayout` and set cookie `isUserBlocked` if blockedReason persists • Once the cookie is set, there is no way to clear the cookie, unless they use devtools. • `useIsUserBlocked()` hook can read if the current browser is owned by blocked user both on browser & during server-side render • Logging out does not clear `isUserBlocked` cookie, thus the value is persisted
github2
00:42:41
<https://coveralls.io/builds/44605203|Coverage Status> Coverage remained the same at 75.363% when pulling *<https://github.com/cofacts/rumors-site/commit/abba9a8d1d01099c6c2ed604acf2e6f0c3f68a6e|abba9a8> on block-user-cookie* into *<https://github.com/cofacts/rumors-site/commit/9a68c273d1fa0199fc8c39f6426117b3ad3fce2e|9a68c27> on master*.