#disinfo

2020-06-01
dang 03:30:12
@vulxj0j8j8 has joined the channel
2020-06-02
pm5 09:01:49
修掉一個 datapublisher 的 bug,正在重新 published 五月 parse 出來的資料,所以應該有很多目錄裡會多出很多資料集檔案
pm5 09:22:23
現在 parse 不出出版日期時間的文章,會被存到一個 `no_date.zip` 裡的 `no_date.jsonl`,所以所有的文章都會存進資料集裡了
pm5 09:51:16
好像應該釐清一下 disinfoRG 與 0archive 的關係? https://g0v.hackmd.io/6ZbDhEwbR1mclAh-ws1B9A
Feng 10:19:29
@pm5 @chihao 早安,弄了一下 chromedriver, 再麻煩看一下我的想法有沒有問題
https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?both
  • 2
  • 1
好喔,感謝意見
喔喔有進展了,感謝 @samtsai15
pm5 11:35:15
Fetch video list according challenge and user from Tik Tok
抖音也能爬?
研究看看 💁‍♂️🏽
Feng 11:51:37
抖音也能爬?
pm5 11:57:44
研究看看 💁‍♂️🏽
chihao 22:22:33
@samtsai15 ++ \o/
  • 😎1
2020-06-03
Ben 10:22:13
Hi all, I've just started contributing a bit with the 0archive project and wanted to say hi on the slack channel 👋
  • 5
wenyi 10:44:23
Welcome, @benwlynch!
pm5 12:53:03
@benwlynch I've updated the installation guide over here https://g0v.hackmd.io/OgKshAg-SFau9xm_SuZRew?view Hope this helps 🙂
Ben 21:54:50
Thanks @pm5! I'll take a look
2020-06-04
pm5 12:56:07
Replied to a thread: 2020-06-02 10:19:29
@samtsai15 我看了一下,回在 https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?view
Feng 12:59:55
好喔,感謝意見
2020-06-06
wenyi 05:27:51
想問一下有沒有知道要怎麼找到fb專頁的管理者,在整理我們follow的fb頁面時發現這五個專頁基本上是一模一樣的內容,想深入了解一下

靠北民進黨 https://www.facebook.com/grumbledpp/
討厭民進黨 https://www.facebook.com/%E8%A8%8E%E5%8E%AD%E6%B0%91%E9%80%B2%E9%BB%A8-504021696772145/
靠北民進黨 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%B0%91%E9%80%B2%E9%BB%A8-454656575008713/
靠北時事 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%99%82%E4%BA%8B-165534787282102/
罷免民進黨 https://www.facebook.com/%E7%BD%B7%E5%85%8D%E6%B0%91%E9%80%B2%E9%BB%A8-2129370967290567/
理論上他選擇隱藏的資訊你不會有機會找到,否則就可以領臉書的獎金了;有時候會遇到新手,用自己的真實帳號去轉發管理粉絲頁文章,大概就是得持續觀察吧
這樣不算 CIB 嗎?coordinated inauthentic behavior
5 個可能還好
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
喔嗚~
Inauthentic 是指假裝成一般人

這幾個 Fb page 感覺沒在假裝 XD
所以是 CAB XDD
側翼在一天內轉傳相近的 material,例如說靈堂比 ya
應該也不構成 CIB
kiang 07:41:34
理論上他選擇隱藏的資訊你不會有機會找到,否則就可以領臉書的獎金了;有時候會遇到新手,用自己的真實帳號去轉發管理粉絲頁文章,大概就是得持續觀察吧
pellaeon 22:56:44
抖音爬蟲我之前用這個覺得蠻好用 https://github.com/drawrowfly/tiktok-scraper
TikTok Scraper. Download video posts, collect user/trend/hashtag/music feed metadata, sign URL and etc.
  • 1
2020-06-07
pm5 11:37:12
許崑源的新聞,有朋友觀察到一開始媒體報導標題會下「自殺」,後來又改成比較委婉(?)的「墜樓」、「跳樓」。不知道我們有沒有抓到修改前後的版本⋯⋯
強大的 google 頁面存擋?
2020-06-08
Feng 10:58:47
強大的 google 頁面存擋?
2020-06-09
pm5 19:43:45
今天有點意料之外的事情無法用電腦開會。我把進度與討論打在這邊
Wrote an installation guide.
Merged a pull request from ben
二月以前要重跑的 publication 跑完了,只跑第一個抓到的版本。現在接著五月抓到的繼續跑
用 social network 的 cluster coefficient 分析了一下政黑版帳號有相同的來源 IP 的情況。計算方式還有一些問題沒有回答清楚,目前只能加減參考。目前的分析有抓出到一個有點名氣的跳板使用者,在大選前我們抓資料的期間還被版友發文點名一直出國玩。文章已刪但我們有抓到。但另外抓出來的帳號,根據一些 IP 資料庫,多半只是用台灣 ISP 的浮動 IP。
收到
pm5 19:44:04
Wrote an installation guide.
pm5 19:44:16
Merged a pull request from ben
pm5 19:45:26
二月以前要重跑的 publication 跑完了,只跑第一個抓到的版本。現在接著五月抓到的繼續跑
pm5 19:53:54
用 social network 的 cluster coefficient 分析了一下政黑版帳號有相同的來源 IP 的情況。計算方式還有一些問題沒有回答清楚,目前只能加減參考。目前的分析有抓出到一個有點名氣的跳板使用者,在大選前我們抓資料的期間還被版友發文點名一直出國玩。文章已刪但我們有抓到。但另外抓出來的帳號,根據一些 IP 資料庫,多半只是用台灣 ISP 的浮動 IP。
chihao 19:58:46
收到
chihao 20:30:53
這樣不算 CIB 嗎?coordinated inauthentic behavior
mrorz 20:33:20
5 個可能還好
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
chihao 20:33:29
喔嗚~
mrorz 20:34:28
Inauthentic 是指假裝成一般人

這幾個 Fb page 感覺沒在假裝 XD
chihao 20:34:58
所以是 CAB XDD
mrorz 20:36:02
側翼在一天內轉傳相近的 material,例如說靈堂比 ya
應該也不構成 CIB
2020-06-10
chihao 18:23:27
airtable 我多開一個 type `微博帳號`
Andy Lin 18:25:55
@a021848 has joined the channel
chihao 18:26:13
hi hi @a021848 \o/
2020-06-15
eli 17:29:25
@mrkuanwong has joined the channel
2020-06-16
wenyi 21:55:24
@benwlynch I just modified ZeroScraper to accept site type as is if it’s missing from the mapping, please let us know if it works on your end!
Ben 21:59:09
@ayw255 Just tested it and it's working now - thanks!
  • 👍2
2020-06-17
pm5 08:45:17
清除一些錯誤的資料,重跑了一個圖,看起來沒有中間那一大團了 https://gist.github.com/pm5/05b990c02e15a1adf89d4c3a6bfd57db
pm5 11:39:19
改成一對帳號要在 3 天以內從同一個來源 IP 發文才有連結。這樣好像真的可以抓出一些怪怪的使用者:

- oftheday, bravee, ORK, qwa317 四人組
- moshenisshit 環遊世界
- Coffeewater, a10141013 從同一個來源發文,前後可以差不到 10 分鐘
- twyes, ksten1688, h0304, winall, AIDM, SangoDragon 小團體
- ⋯⋯還有一些還沒仔細看的
2020-06-20
wenyi 02:39:52
Hey @benwlynch, I updated the FbScraper README (https://github.com/disinfoRG/FbScraper#fbscraper), hope it helps!
2020-06-21
taiwanfifi 19:16:23
@taiwanfifi has joined the channel
2020-06-23
pm5 10:04:22
Replied to a thread: 2020-06-02 10:19:29
喔喔有進展了,感謝 @samtsai15
  • 😎1
fly 15:01:50
Google 整合各國fact check平台 https://toolbox.google.com/factcheck/explorer/search/covid;hl=zh

假消息圖片會加註
Now, when you search on Google Images, you may see a “Fact Check” label under the thumbnail image results.
https://www.blog.google/products/search/bringing-fact-check-information-google-images/

還有 api
https://toolbox.google.com/factcheck/apis
Google
We are surfacing fact check information in Google Images globally to help people make more informed judgments about what they see on the web.
  • 2
  • 1
pm5 22:00:19
@chihao @ayw255 咦我們還有要講什麼嗎?
chihao 22:00:37
啊 \o/
chihao 22:01:45
上線了
2020-06-24
chihao 18:06:53
關心不實訊息的大家好,今年底即將在台南舉行的 g0v summit 正在徵稿中,不管是國際串連、新聞媒體、事實查核、媒體識讀、數位人權,都跟不實訊息很有關係哦 😁 如果你有專案想分享,或是你有認識的人想推坑,請務必在 6/30 之前新增稿件,在 8/2 前都可以在投稿系統討論區中公開討論、改稿。期待各位的投稿! 👉 https://propose.summit2020.g0v.tw/
cfp-open-horizontal.png
  • ❤️3
2020-06-27
chihao 23:21:29
@ayw255 要投一個 0archive 嗎?😁
思考一下XDD
投嘛投嘛 XDD
投啦投啦
投了投了😂
wenyi ++ \o/ \o/ \o/ 轉圈
2020-06-28
wenyi 08:10:57
思考一下XDD
2020-06-29
chihao 02:56:02
投嘛投嘛 XDD
wenyi 21:26:52
投稿中但無法新增講者頭像 該如何是好 QQQ
delightfullychaotic 2020-06-29 21:28:13
我會轉到 marketing 的群組 但是大家可以在 #summit 反應
好嗚,已經轉到 #summit
chihao 21:27:12
#summit 頻道回報 bug?XD
delightfullychaotic 21:28:13
我會轉到 marketing 的群組 但是大家可以在 #summit 反應
wenyi 21:31:44
Replied to a thread: 2020-06-29 21:26:52
好嗚,已經轉到 #summit
  • 🙏1
2020-06-30
isabelhou 04:52:22
投啦投啦
wenyi 06:58:35
投了投了😂
chihao 09:58:42
wenyi ++ \o/ \o/ \o/ 轉圈