#cofacts

2019-04-01
jimhorng 15:15:19
了解, 只是好奇user拿到的訊息片段有可能是變形過的, 但或許相似度很高可以直接歸類在資料庫某篇文章, 這樣可以多了解 每篇文章可能的變形有哪些 🙂
2019-04-03
cwkung2016 15:38:12
@cwkung2016 has joined the channel
gugod 16:37:37
@gugod has joined the channel
mTwTm 16:52:05
@g0v193 has joined the channel
mTwTm 16:59:36
@mrorz 本來要問 _score 但剛好發現有這篇 _score 應該就是 elastic search 的 score
mrorz 17:00:26
嗯, sort option 裡的 _score 確實就是 elasticsearch 的 _score
mTwTm 17:00:29
從 bot source 我有找到 string-similarity 但我沒看到 `minimim_should_match` 的相關邏輯
mrorz 17:01:27
bot 是使用 cofacts-api 預設的 minimum_should_match
mTwTm 17:01:50
ok 所以 `minimim_should_match` 的確是 API 的邏輯?
mrorz 17:02:29
GitHub
GraphQL API server for clients like rumors-site and rumors-line-bot - cofacts/rumors-api
mTwTm 17:03:16
Background: 我們正在想辦法盡量貼近 Line bot 的邏輯所以原本誤用 sort by _score 現在我照抄 bot 邏輯搞定 similarity 了但我剛好看到這串想確定一下 `minimim_should_match` 是不是 bot 有處理還是其實比較算是 API internal
mTwTm 17:03:52
I see 那應該跟我想的一樣 thanks!
mrorz 17:04:26
`minimumShouldMatch` 確實是要 expose 出去給 API user 來調控相似度 threshold 的唷
mrorz 17:04:51
例如說 cofacts site 的 search box 其實就是給一個比較鬆的 minimumShouldMatch
mTwTm 17:04:52
但如果沒給的時候有個預設值 & line-bot 是沒給的情況(嗎)
mrorz 17:05:21
對,預設就是 API server 裡的剛才貼的那裡
mTwTm 17:05:58
Nice!
  • 👍1
mTwTm 17:07:59
GitHub
Contribute to mozilla-tw/checkNshare development by creating an account on GitHub.
  • 💯2
Anping 19:45:45
@zhaoanping has joined the channel
2019-04-10
wildjcrt 10:26:11
@wildjcrt has joined the channel
wildjcrt 10:26:25
科技島讀
傳言中資大舉收購台灣粉絲專頁,但卻很難證明,更難追究。本文提出打擊假新聞的短、中、長期三種可能作法。
  • 👍1
最近一波都有整理進去,好猛

收進相關新聞囉
https://beta.hackfoldr.org/cofacts/https%253A%252F%252Fhackmd.io%252Fs%252FHkhTS45ig
@mrorz 「手段」標題少了一個字~
說實話, 爆料從南農中心轉帳的那篇的PTT 帳號, 也被爆有問題
我覺得是網內互打的成分居多
簡單的說, 就是 ken4645 爆料買粉絲頁是從南農中心轉帳所以可能跟王金平/韓國瑜有關 , 被 a5378623 和 ReDmango 反爆料, 懷疑 ken4645 的帳號其實也交易過 , 但 a5378623 的 IP 被追出來跟國民黨有關
https://www.ptt.cc/bbs/Gossiping/M.1554642741.A.78F.html
https://www.ptt.cc/bbs/Gossiping/M.1554652450.A.2FB.html
http://fun01.co/post/827351/
mrorz 13:04:52
最近一波都有整理進去,好猛

收進相關新聞囉
https://beta.hackfoldr.org/cofacts/https%253A%252F%252Fhackmd.io%252Fs%252FHkhTS45ig
wildjcrt 14:37:03
@mrorz 「手段」標題少了一個字~
  • 👌1
pofeng 19:55:51
說實話, 爆料從南農中心轉帳的那篇的PTT 帳號, 也被爆有問題
pofeng 19:56:12
我覺得是網內互打的成分居多
pofeng 20:21:52
簡單的說, 就是 ken4645 爆料買粉絲頁是從南農中心轉帳所以可能跟王金平/韓國瑜有關 , 被 a5378623 和 ReDmango 反爆料, 懷疑 ken4645 的帳號其實也交易過 , 但 a5378623 的 IP 被追出來跟國民黨有關
https://www.ptt.cc/bbs/Gossiping/M.1554642741.A.78F.html
https://www.ptt.cc/bbs/Gossiping/M.1554652450.A.2FB.html
http://fun01.co/post/827351/
  • 1
pofeng (ocf) 21:29:04
@pofeng240 has joined the channel
2019-04-11
wildjcrt 00:27:36
@wildjcrt has left the channel
wing 13:07:02
@wing has joined the channel
ShuHuai(Whycat) 17:51:07
@junsuwhy has joined the channel
2019-04-12
Jiangweiqi 12:59:05
@wq has joined the channel
2019-04-17
jimhorng 11:10:39
請教 這篇文章不知為何出現 `500 Internal Server Error.`
https://cofacts.hacktabl.org/article/16m5tbcrjgctf
id: `16m5tbcrjgctf` 是從 來的 https://github.com/cofacts/opendata/tree/master/data
data也有內容
```
超強防癌聖品「奇異果、芭樂」 醫:這時間點吃最好

2019/02/18 11:33
小 中 大

想降低罹癌風險,中醫師建議可以吃奇異果、芭樂,且在飯後半小時吃最好。圖/TVBS
當亞硝酸鹽和胺類同時吃下肚,恐形成超強致癌物「亞硝胺」,但你知道在我們日常飲食中,恐不自覺同時接觸了這些食物嗎?醫師提醒,含有大量亞硝酸鹽食物如香腸、臘肉等最好少吃;而若想降低罹癌風險,醫師也建議可以吃奇異果、芭樂,且在飯後半小時吃最好。
...
```
感謝~
GitHub
Open data of Cofacts collaborative fact-checking database - cofacts/opendata
mrorz 11:12:48
@jimhorng cofacts.hacktabl.org 是 staging site 唷,資料庫跟 production 分開。看起來 `16m5tbcrjgctf` 在 staging 資料庫沒有,然後我沒處理好 404 就變成 500 了⋯⋯ XD”
jimhorng 11:13:58
了解~ 感謝
bil 14:18:20
https://cofacts.g0v.tw/article/AV3cwvmryCdS-nWhueK0

你們在OK什麼啦!!!!囧(本來還覺得很困惑為什麼會有人會在文章列表下推ok…..)
  • 😂2
準備好了 請輸入: OK 即可觀看
ggm 14:24:46
準備好了 請輸入: OK 即可觀看
ysw 22:57:31
@tiuswong has joined the channel
2019-04-22
mrorz 12:20:48
@ggm @darkbtf @acerxp511 上個禮拜聊到的,希望實作「用 push API 通知 LINE 使用者有新回應」這個東西的實作,我先把 design 寫在這裡:
https://g0v.hackmd.io/JM0MhuzfTl-DaPmwhYZL7A#%E8%83%BD%E6%8E%A8%E6%92%AD%E7%9A%84%E6%96%B0%E5%8A%9F%E8%83%BD

- 無論 LINE 使用者是訊息送出者、查詢某則訊息之後不管有沒有得到回應,都會紀錄「這個使用者查了這篇」於資料表 `userArticleLink`
- cron job 撈出新的 ArticleReply,然後通知查了這篇的使用者
- 用 LIFF 顯示自己過去查過的列表

想問 Heroku 有啥好的免費(或便宜付費) DB 可以實作 `userArticleLink`?如果沒有的話那我選 mLab 唷,496mb 免費,就算 1 document 有 1k 也可以存 496,000 筆資料。
ggm 15:57:53
mlab 應該是最便宜的了?或是開在我的 gcp XD
2019-04-23
mrorz 01:27:39
另外就是
我想在 line bot 的 LIFF 從現在的 vanilla js 改成用 svelte,覺得大小很適合玩玩看
https://svelte.dev

因為我懶得再寫一堆 `querySelector('xxx').innerHTML` 惹。
有人覺得 svelte 會雷雷嗎
@acerxp511 @lucien @sunrise91.t3
svelte.dev
Cybernetically enhanced web apps
沒試過,那時候只是覺得他範例很少
但看之前的 report 覺得一試
okok
lucien 21:21:03
沒試過,那時候只是覺得他範例很少
lucien 21:21:27
但看之前的 report 覺得一試
mrorz 23:46:18
okok
2019-04-24
2019-04-25
chihao 16:39:20
twreporter.org
我們在印尼遇見站上真假之戰第一線的三群記者,以寫程式、創業、虛實對話等方式,當起謠言獵人。在他們眼中,假新聞是網路時代對國家、媒體轉型的試煉。
chihao 16:39:31
> 對滇米卡來說,核實是一塊缺了的拼圖,媒體是最適合人選。他要求網路平台業者加入計畫,也與MAFINDO合作,要在WhatsApp上建立機器人程式,讓民眾加入回報的行列,「這是參考台灣團體Cofacts的!」他對台灣表示感謝。
  • 8
chihao 16:45:40
\/ \/ \/
  • 4
mrorz 17:03:55
我們跟 Wahyu 應該是在 2017 年 Google news lab summit APAC 碰過面
印尼專案真的很厲害!
  • 🙌1
mrorz 17:06:00
裡面的 CEK FAKTA 其實直接的 reference 是法國總統大選的 crosscheck 專案
mrorz 17:08:33
https://www.thejakartapost.com/news/2018/05/05/press-societies-launch-antihoax-website.html
CEK FAKTA 也是在雅加達的 Trusted Media Summit (前身為 Google News Lab Summit) 前面照相
The Jakarta Post
In an unprecedented move, 22 national and regional news media organizations and a number of associations have launched a website to debunk false news and hoaxes ahead of the 2019 elections.
mrorz 17:08:57
Google 在這背後其實默默做了不少平台的角色
chihao 17:16:29
背板的字體就是 Google 的官方字體 `Product Sans` 😆
  • 1
2019-04-26
shadowcrow 15:02:15
@shadowcrow has joined the channel
2019-04-28
pofeng 18:50:33
@mrorz @ggm @bil hi hi 三位其中有人今晚有空能上線 (maybe hangout or skype) 聊一下嗎 ? 抱歉有點急, 是關於 GEC grant 的事 ( 明天就要送出了) CC: @rockhung99