#disinfo
2020-06-01
dang
03:30:12
@vulxj0j8j8 has joined the channel
2020-06-02
pm5
09:01:49
修掉一個 datapublisher 的 bug,正在重新 published 五月 parse 出來的資料,所以應該有很多目錄裡會多出很多資料集檔案
pm5
09:22:23
現在 parse 不出出版日期時間的文章,會被存到一個 `no_date.zip` 裡的 `no_date.jsonl`,所以所有的文章都會存進資料集裡了
Feng
10:19:29
@pm5 @chihao 早安,弄了一下 chromedriver, 再麻煩看一下我的想法有沒有問題
https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?both
https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?both
2
1
@samtsai15 我看了一下,回在 https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?view
Feng
2020-06-04 12:59:55
好喔,感謝意見
喔喔有進展了,感謝 @samtsai15
pm5
11:34:32
Feng
11:51:37
抖音也能爬?
pm5
11:57:44
研究看看 💁♂️🏽
2020-06-03
Ben
10:22:13
Hi all, I've just started contributing a bit with the 0archive project and wanted to say hi on the slack channel 👋
5
wenyi
10:44:23
Welcome, @benwlynch!
pm5
12:53:03
@benwlynch I've updated the installation guide over here https://g0v.hackmd.io/OgKshAg-SFau9xm_SuZRew?view Hope this helps 🙂
Ben
21:54:50
Thanks @pm5! I'll take a look
2020-06-04
pm5
12:56:07
Replied to a thread: 2020-06-02 10:19:29
@samtsai15 我看了一下,回在 https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?view
Feng
12:59:55
好喔,感謝意見
2020-06-06
wenyi
05:27:51
想問一下有沒有知道要怎麼找到fb專頁的管理者,在整理我們follow的fb頁面時發現這五個專頁基本上是一模一樣的內容,想深入了解一下
靠北民進黨 https://www.facebook.com/grumbledpp/
討厭民進黨 https://www.facebook.com/%E8%A8%8E%E5%8E%AD%E6%B0%91%E9%80%B2%E9%BB%A8-504021696772145/
靠北民進黨 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%B0%91%E9%80%B2%E9%BB%A8-454656575008713/
靠北時事 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%99%82%E4%BA%8B-165534787282102/
罷免民進黨 https://www.facebook.com/%E7%BD%B7%E5%85%8D%E6%B0%91%E9%80%B2%E9%BB%A8-2129370967290567/
靠北民進黨 https://www.facebook.com/grumbledpp/
討厭民進黨 https://www.facebook.com/%E8%A8%8E%E5%8E%AD%E6%B0%91%E9%80%B2%E9%BB%A8-504021696772145/
靠北民進黨 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%B0%91%E9%80%B2%E9%BB%A8-454656575008713/
靠北時事 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%99%82%E4%BA%8B-165534787282102/
罷免民進黨 https://www.facebook.com/%E7%BD%B7%E5%85%8D%E6%B0%91%E9%80%B2%E9%BB%A8-2129370967290567/
kiang
2020-06-06 07:41:34
理論上他選擇隱藏的資訊你不會有機會找到,否則就可以領臉書的獎金了;有時候會遇到新手,用自己的真實帳號去轉發管理粉絲頁文章,大概就是得持續觀察吧
chihao
2020-06-09 20:30:53
這樣不算 CIB 嗎?coordinated inauthentic behavior
mrorz
2020-06-09 20:33:20
5 個可能還好
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
chihao
2020-06-09 20:33:29
喔嗚~
mrorz
2020-06-09 20:34:28
Inauthentic 是指假裝成一般人
這幾個 Fb page 感覺沒在假裝 XD
這幾個 Fb page 感覺沒在假裝 XD
chihao
2020-06-09 20:34:58
所以是 CAB XDD
mrorz
2020-06-09 20:36:02
側翼在一天內轉傳相近的 material,例如說靈堂比 ya
應該也不構成 CIB
應該也不構成 CIB
kiang
07:41:34
理論上他選擇隱藏的資訊你不會有機會找到,否則就可以領臉書的獎金了;有時候會遇到新手,用自己的真實帳號去轉發管理粉絲頁文章,大概就是得持續觀察吧
pellaeon
22:56:44
抖音爬蟲我之前用這個覺得蠻好用 https://github.com/drawrowfly/tiktok-scraper
TikTok Scraper. Download video posts, collect user/trend/hashtag/music feed metadata, sign URL and etc.
1
2020-06-07
pm5
11:37:12
許崑源的新聞,有朋友觀察到一開始媒體報導標題會下「自殺」,後來又改成比較委婉(?)的「墜樓」、「跳樓」。不知道我們有沒有抓到修改前後的版本⋯⋯
Feng
2020-06-08 10:58:47
強大的 google 頁面存擋?
2020-06-08
Feng
10:58:47
強大的 google 頁面存擋?
2020-06-09
pm5
19:43:45
今天有點意料之外的事情無法用電腦開會。我把進度與討論打在這邊
Wrote an installation guide.
Merged a pull request from ben
二月以前要重跑的 publication 跑完了,只跑第一個抓到的版本。現在接著五月抓到的繼續跑
用 social network 的 cluster coefficient 分析了一下政黑版帳號有相同的來源 IP 的情況。計算方式還有一些問題沒有回答清楚,目前只能加減參考。目前的分析有抓出到一個有點名氣的跳板使用者,在大選前我們抓資料的期間還被版友發文點名一直出國玩。文章已刪但我們有抓到。但另外抓出來的帳號,根據一些 IP 資料庫,多半只是用台灣 ISP 的浮動 IP。
chihao
2020-06-09 19:58:46
收到
pm5
19:44:04
Wrote an installation guide.
pm5
19:44:16
Merged a pull request from ben
pm5
19:45:26
二月以前要重跑的 publication 跑完了,只跑第一個抓到的版本。現在接著五月抓到的繼續跑
pm5
19:53:54
用 social network 的 cluster coefficient 分析了一下政黑版帳號有相同的來源 IP 的情況。計算方式還有一些問題沒有回答清楚,目前只能加減參考。目前的分析有抓出到一個有點名氣的跳板使用者,在大選前我們抓資料的期間還被版友發文點名一直出國玩。文章已刪但我們有抓到。但另外抓出來的帳號,根據一些 IP 資料庫,多半只是用台灣 ISP 的浮動 IP。
chihao
19:58:46
收到
chihao
20:30:53
這樣不算 CIB 嗎?coordinated inauthentic behavior
mrorz
20:33:20
5 個可能還好
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
chihao
20:33:29
喔嗚~
mrorz
20:34:28
Inauthentic 是指假裝成一般人
這幾個 Fb page 感覺沒在假裝 XD
這幾個 Fb page 感覺沒在假裝 XD
chihao
20:34:58
所以是 CAB XDD
mrorz
20:36:02
側翼在一天內轉傳相近的 material,例如說靈堂比 ya
應該也不構成 CIB
應該也不構成 CIB
2020-06-10
chihao
18:23:27
airtable 我多開一個 type `微博帳號`
Andy Lin
18:25:55
@a021848 has joined the channel
chihao
18:26:13
hi hi @a021848 \o/
2020-06-15
eli
17:29:25
@mrkuanwong has joined the channel
2020-06-16
wenyi
21:55:24
@benwlynch I just modified ZeroScraper to accept site type as is if it’s missing from the mapping, please let us know if it works on your end!
2020-06-17
pm5
08:45:17
清除一些錯誤的資料,重跑了一個圖,看起來沒有中間那一大團了 https://gist.github.com/pm5/05b990c02e15a1adf89d4c3a6bfd57db
pm5
11:39:19
改成一對帳號要在 3 天以內從同一個來源 IP 發文才有連結。這樣好像真的可以抓出一些怪怪的使用者:
- oftheday, bravee, ORK, qwa317 四人組
- moshenisshit 環遊世界
- Coffeewater, a10141013 從同一個來源發文,前後可以差不到 10 分鐘
- twyes, ksten1688, h0304, winall, AIDM, SangoDragon 小團體
- ⋯⋯還有一些還沒仔細看的
- oftheday, bravee, ORK, qwa317 四人組
- moshenisshit 環遊世界
- Coffeewater, a10141013 從同一個來源發文,前後可以差不到 10 分鐘
- twyes, ksten1688, h0304, winall, AIDM, SangoDragon 小團體
- ⋯⋯還有一些還沒仔細看的
2020-06-20
wenyi
02:39:52
Hey @benwlynch, I updated the FbScraper README (https://github.com/disinfoRG/FbScraper#fbscraper), hope it helps!
2020-06-21
taiwanfifi
19:16:23
@taiwanfifi has joined the channel
2020-06-23
fly
15:01:50
Google 整合各國fact check平台 https://toolbox.google.com/factcheck/explorer/search/covid;hl=zh
假消息圖片會加註
Now, when you search on Google Images, you may see a “Fact Check” label under the thumbnail image results.
https://www.blog.google/products/search/bringing-fact-check-information-google-images/
還有 api
https://toolbox.google.com/factcheck/apis
假消息圖片會加註
Now, when you search on Google Images, you may see a “Fact Check” label under the thumbnail image results.
https://www.blog.google/products/search/bringing-fact-check-information-google-images/
還有 api
https://toolbox.google.com/factcheck/apis
We are surfacing fact check information in Google Images globally to help people make more informed judgments about what they see on the web.![]()
2
1
pm5
22:00:19
@chihao @ayw255 咦我們還有要講什麼嗎?
chihao
22:00:37
啊 \o/
chihao
22:01:45
上線了
2020-06-24
chihao
18:06:53
關心不實訊息的大家好,今年底即將在台南舉行的 g0v summit 正在徵稿中,不管是國際串連、新聞媒體、事實查核、媒體識讀、數位人權,都跟不實訊息很有關係哦 😁 如果你有專案想分享,或是你有認識的人想推坑,請務必在 6/30 之前新增稿件,在 8/2 前都可以在投稿系統討論區中公開討論、改稿。期待各位的投稿! 👉 https://propose.summit2020.g0v.tw/
- ❤️3
2020-06-27
chihao
23:21:29
@ayw255 要投一個 0archive 嗎?😁
wenyi
2020-06-28 08:10:57
思考一下XDD
chihao
2020-06-29 02:56:02
投嘛投嘛 XDD
isabelhou
2020-06-30 04:52:22
投啦投啦
wenyi
2020-06-30 06:58:35
投了投了😂
chihao
2020-06-30 09:58:42
wenyi ++ \o/ \o/ \o/ 轉圈
2020-06-28
wenyi
08:10:57
思考一下XDD
2020-06-29
chihao
02:56:02
投嘛投嘛 XDD
wenyi
21:26:52
投稿中但無法新增講者頭像 該如何是好 QQQ
delightfullychaotic
2020-06-29 21:28:13
我會轉到 marketing 的群組 但是大家可以在 #summit 反應
wenyi
2020-06-29 21:31:44
好嗚,已經轉到 #summit
2020-06-30
isabelhou
04:52:22
投啦投啦
wenyi
06:58:35
投了投了😂
chihao
09:58:42
wenyi ++ \o/ \o/ \o/ 轉圈