disinfo

Month: 2020-06

2020-06-01

dang 03:30:12
@vulxj0j8j8 has joined the channel

2020-06-02

pm5 09:01:49
修掉一個 datapublisher 的 bug,正在重新 published 五月 parse 出來的資料,所以應該有很多目錄裡會多出很多資料集檔案
pm5 09:22:23
現在 parse 不出出版日期時間的文章,會被存到一個 `no_date.zip` 裡的 `no_date.jsonl`,所以所有的文章都會存進資料集裡了
pm5 09:51:16
好像應該釐清一下 disinfoRG 與 0archive 的關係? https://g0v.hackmd.io/6ZbDhEwbR1mclAh-ws1B9A

g0v.hackmd.io

disinfoRG: Disinformation Research Group - HackMD

Feng 10:19:29
@pm5 @chihao 早安,弄了一下 chromedriver, 再麻煩看一下我的想法有沒有問題
https://g0v.hackmd.io/kT5nKZdhRdKuLCTVEDyBkA?both

g0v.hackmd.io

Build selenium / chromedrive server - HackMD

好喔,感謝意見
喔喔有進展了,感謝 @samtsai15
2 1
pm5 11:35:15
https://github.com/usunyu/tiktok-crawler

usunyu/tiktok-crawler

Fetch video list according challenge and user from Tik Tok

抖音也能爬?
研究看看 💁‍♂️🏽
chihao 22:22:33
@samtsai15 ++ \o/
😎 1

2020-06-03

Ben 10:22:13
Hi all, I've just started contributing a bit with the 0archive project and wanted to say hi on the slack channel 👋
5
wenyi 10:44:23
Welcome, @benwlynch!
pm5 12:53:03
@benwlynch I've updated the installation guide over here https://g0v.hackmd.io/OgKshAg-SFau9xm_SuZRew?view Hope this helps 🙂

g0v.hackmd.io

ArticleParser Installation Guide - HackMD

Ben 21:54:50
Thanks @pm5! I'll take a look

2020-06-04

2020-06-06

wenyi 05:27:51
想問一下有沒有知道要怎麼找到fb專頁的管理者,在整理我們follow的fb頁面時發現這五個專頁基本上是一模一樣的內容,想深入了解一下

靠北民進黨 https://www.facebook.com/grumbledpp/
討厭民進黨 https://www.facebook.com/%E8%A8%8E%E5%8E%AD%E6%B0%91%E9%80%B2%E9%BB%A8-504021696772145/
靠北民進黨 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%B0%91%E9%80%B2%E9%BB%A8-454656575008713/
靠北時事 https://www.facebook.com/%E9%9D%A0%E5%8C%97%E6%99%82%E4%BA%8B-165534787282102/
罷免民進黨 https://www.facebook.com/%E7%BD%B7%E5%85%8D%E6%B0%91%E9%80%B2%E9%BB%A8-2129370967290567/
理論上他選擇隱藏的資訊你不會有機會找到,否則就可以領臉書的獎金了;有時候會遇到新手,用自己的真實帳號去轉發管理粉絲頁文章,大概就是得持續觀察吧
這樣不算 CIB 嗎?coordinated inauthentic behavior
5 個可能還好
但如果有什麼回報給 Facebook 的管道的話,或許可以提供給他們進行觀察
喔嗚~
Inauthentic 是指假裝成一般人

這幾個 Fb page 感覺沒在假裝 XD
所以是 CAB XDD
側翼在一天內轉傳相近的 material,例如說靈堂比 ya
應該也不構成 CIB
pellaeon 22:56:44
抖音爬蟲我之前用這個覺得蠻好用 https://github.com/drawrowfly/tiktok-scraper

drawrowfly/tiktok-scraper

TikTok Scraper. Download video posts, collect user/trend/hashtag/music feed metadata, sign URL and etc.

1

2020-06-07

pm5 11:37:12
許崑源的新聞,有朋友觀察到一開始媒體報導標題會下「自殺」,後來又改成比較委婉(?)的「墜樓」、「跳樓」。不知道我們有沒有抓到修改前後的版本⋯⋯
強大的 google 頁面存擋?

2020-06-08

2020-06-09

pm5 19:43:45
今天有點意料之外的事情無法用電腦開會。我把進度與討論打在這邊
Wrote an installation guide.
Merged a pull request from ben
二月以前要重跑的 publication 跑完了,只跑第一個抓到的版本。現在接著五月抓到的繼續跑
用 social network 的 cluster coefficient 分析了一下政黑版帳號有相同的來源 IP 的情況。計算方式還有一些問題沒有回答清楚,目前只能加減參考。目前的分析有抓出到一個有點名氣的跳板使用者,在大選前我們抓資料的期間還被版友發文點名一直出國玩。文章已刪但我們有抓到。但另外抓出來的帳號,根據一些 IP 資料庫,多半只是用台灣 ISP 的浮動 IP。
收到

2020-06-10

chihao 18:23:27
airtable 我多開一個 type `微博帳號`
Andy Lin 18:25:55
@a021848 has joined the channel
chihao 18:26:13
hi hi @a021848 \o/

2020-06-15

eli 17:29:25
@mrkuanwong has joined the channel

2020-06-16

wenyi 21:55:24
@benwlynch I just modified ZeroScraper to accept site type as is if it’s missing from the mapping, please let us know if it works on your end!
Ben 21:59:09
@ayw255 Just tested it and it's working now - thanks!
👍 2

2020-06-17

pm5 08:45:17
清除一些錯誤的資料,重跑了一個圖,看起來沒有中間那一大團了 https://gist.github.com/pm5/05b990c02e15a1adf89d4c3a6bfd57db
pm5 11:39:19
改成一對帳號要在 3 天以內從同一個來源 IP 發文才有連結。這樣好像真的可以抓出一些怪怪的使用者:

- oftheday, bravee, ORK, qwa317 四人組
- moshenisshit 環遊世界
- Coffeewater, a10141013 從同一個來源發文,前後可以差不到 10 分鐘
- twyes, ksten1688, h0304, winall, AIDM, SangoDragon 小團體
- ⋯⋯還有一些還沒仔細看的

2020-06-20

wenyi 02:39:52
Hey @benwlynch, I updated the FbScraper README (https://github.com/disinfoRG/FbScraper#fbscraper), hope it helps!

disinfoRG/FbScraper

2020-06-21

taiwanfifi 19:16:23
@taiwanfifi has joined the channel

2020-06-23

pm5 10:04:22
喔喔有進展了,感謝 @samtsai15
😎 1
fly 15:01:50
Google 整合各國fact check平台 https://toolbox.google.com/factcheck/explorer/search/covid;hl=zh

假消息圖片會加註
Now, when you search on Google Images, you may see a “Fact Check” label under the thumbnail image results.
https://www.blog.google/products/search/bringing-fact-check-information-google-images/

還有 api
https://toolbox.google.com/factcheck/apis

Google

Bringing fact check information to Google Images

We are surfacing fact check information in Google Images globally to help people make more informed judgments about what they see on the web.

2 1
pm5 22:00:19
@chihao @ayw255 咦我們還有要講什麼嗎?
chihao 22:00:37
啊 \o/
chihao 22:01:45
上線了

2020-06-24

chihao 18:06:53
關心不實訊息的大家好,今年底即將在台南舉行的 g0v summit 正在徵稿中,不管是國際串連、新聞媒體、事實查核、媒體識讀、數位人權,都跟不實訊息很有關係哦 😁 如果你有專案想分享,或是你有認識的人想推坑,請務必在 6/30 之前新增稿件,在 8/2 前都可以在投稿系統討論區中公開討論、改稿。期待各位的投稿! 👉 https://propose.summit2020.g0v.tw/
cfp-open-horizontal.png
❤️ 3

2020-06-27

chihao 23:21:29
@ayw255 要投一個 0archive 嗎?😁
思考一下XDD
投嘛投嘛 XDD
投啦投啦
投了投了😂
wenyi ++ \o/ \o/ \o/ 轉圈

2020-06-28

2020-06-29

wenyi 21:26:52
投稿中但無法新增講者頭像 該如何是好 QQQ
delightfullychaotic 2020-06-29 21:28:13
我會轉到 marketing 的群組 但是大家可以在 #summit 反應
好嗚,已經轉到 #summit
chihao 21:27:12
#summit 頻道回報 bug?XD
wenyi 21:31:44
好嗚,已經轉到 #summit
🙏 1

2020-06-30