cofacts

Month: 2020-02

2020-02-01

mrorz 21:19:03
我剛才發現 URL resolve 出來的順序是亂的,應該是上週上新版 API 導致的。這有點糟糕,因為之前抓錯的文件都已經寫入資料庫了,之後會繼續錯⋯⋯
https://cofacts.g0v.tw/reply/JWXgAHABd3n3h-WYH10s

讓我想想如何補救⋯⋯
mrorz 22:20:47
Fixed, 求 @changhc84 review

2020-02-02

ggm 14:26:22
[Rollbar] Free plan limit reached for account mrorz
mrorz 15:53:04
對 QAQ
新版網站一直噴 error 很 GG
mrorz 16:07:20
我覺得先處理這兩個好了
mrorz 16:08:25
看起來是 rumors-site 一直花 quota
mrorz 17:40:27
129249
mrorz 17:40:36
今天 chatbot 記憶體一直爆炸
到底發生什麼事情囧
mrorz 17:41:43
最近人數很多
129250
mrorz 17:44:23
129251
mrorz 17:44:42
1/30 也很多 囧
mrorz 17:47:30
@ggm 我們可能需要升級到 standard-2X dynos / 1 GB memory
mrorz 17:49:29
但他每個月 50usd / month……
Linode 便宜得多
ggm 17:51:20
好啊
mrorz 17:52:14
我們目前是有那個 capacity 直接就地升級沒錯
mrorz 17:56:59
還是開 2 個 standard 呀
Heroku 可以 1 個 2 個 autoscale 嗎?
1 個 standard 2x 與兩個 standard 我沒有太大經驗
mrorz 18:08:06
都忘了 heroku dashboard 有 metrics tab
mrorz 18:08:08
mrorz 18:09:08
Response time 一直不大
mrorz 18:09:26
就是偶爾 memory 爆炸
mrorz 18:09:58
mrorz 19:26:23
今天是使用 Standard 1x (依舊是512mb)
看起來這種 memory spike 會持續數分鐘,所以可以弄個 autoscale script
如果有 memory quota 問題就 scale up 成 2 ~ 3 台
然後如果 memory 降下來就 scale down 成 1 台
之類的。
mrorz 19:29:13
至於 scale up 變成 2 台 512mb 的機器會不會改善,其實現在就是開 2 台
下午開了兩台之後, memory 到現在為止沒有異狀
mrorz 03:22:38
目前先這樣設定
1 是 1 台 25USD 的 standard-1x (512MB RAM)
2:1X 就是 2 台 25USD 的 standard-1x (還是 512MB RAM 但有兩台)
mrorz 03:23:31
設定的參考依據是 production LINE bot google analytics
bil 18:31:34
八點預計會發這個貼文喔(LINE帳號好像快過期了QQQQ)
image.png
bil 18:40:33
• 過去一個月送出資料庫的新文章成長近九成、工作量大增,單日使用人數也超過1,400人
• chatbot活躍使用者超過去年同期四倍
• 本月使用者轉傳的訊息也上升6成
• 農曆新年時期其實是最忙碌的時期,不實訊息全年無休,感謝所有年節大德貢獻與參與
鄰鄰蹦蹦跳跳!!!!!!!!
bess 21:15:37
要發個賀文(?)在粉專上嗎 :smirk:
bil 00:58:32
賀。過年人很多、人旺chatbot旺

2020-02-03

chihao 08:38:13
熱鬧 \o/

2020-02-04

mrorz 02:34:16
今天討論完 article reply 與 postgres,回頭看了一下 postgresql 的 fulltext search

雖然 postgresql 可以做 tokenization 與 cosine similarity search,但其實一些 text retrieval 會用的像是 tf-idf 與 smoothing 之類 elasticsearch 會做的東西都沒有這樣。

讓我想到是否該認真考慮 ZomboDB,這幾年來 ZomboDB 的開發居然都沒斷過真的很神:
https://github.com/zombodb/zombodb

GitHub

zombodb/zombodb

Making Postgres and Elasticsearch work together like it's 2020 - zombodb/zombodb

ggm 11:31:05
https://www.blog.google/around-the-globe/google-asia/indian-journalists-fighting-fake-news/

Google

The Indian journalists fighting fake news

The Google News Initiative is stepping up its work to train journalists and strengthen media literacy in India, building on a successful first year.

ggm 11:31:25
google 朋友轉給我的 XD
annahung 17:59:40
@fbiannahung has joined the channel
Mike 18:01:31
@a3804430 has joined the channel
WeiLing 18:12:42
@weling.su has joined the channel
bess 19:24:15
想來敲敲這週 Cofacts 小聚有沒有防疫措施,我們想參考看看 ._.
bess 19:24:30
cc @chiehg0v
mrorz 21:26:42
印這個算嗎
tmonk 22:04:37
洗手七式很有幫助,在醫院也很常看到。
Dawn 23:05:34
@me1614 has joined the channel
AlcHawk 23:51:37
@alchawk has joined the channel

2020-02-05

Gary 10:01:30
@ma.gary729 has joined the channel
turtalk 11:22:30
@turtalk has joined the channel
Angel Lee 14:06:22
@fangyulee0102 has joined the channel
bil 20:13:07
嗨嗨有台南小松的朋友嗎
delightfullychaotic 20:17:08
可以直接到 #tainan 版噢
delightfullychaotic 20:17:11
那邊有朋友
bil 20:17:59
感謝感謝
kuro 20:18:56
@kuro has joined the channel
delightfullychaotic 20:34:34
規範問題II
```- 提供更好的服務之目的,本團隊得將部分用戶資訊再授權與第三方專業聊天機器人資料分析團隊,以了解用戶的背景與喜好,並對本服務進行修正,以求更符合用戶需求。
- 本團隊將嚴格要求合作之第三方專業聊天機器人資料分析團隊恪守尊重用戶隱私權與隱私法規之規定,並確保用戶資訊不外流。
- 若用戶對本服務產生疑慮,得聯繫本團隊要求刪除、修改其在本服務或合作之第三方專業聊天機器人資料分析團隊中的用戶資料。```
delightfullychaotic 20:35:08
這些應該不用了
delightfullychaotic 20:35:13
確認一下
bil 20:45:04
在說botimizer媽,是的是的
delightfullychaotic 20:46:13
我想要確認一下 我們現在刪掉 Chatbot 使用者的常見原因有哪些?
bil 20:49:23
咦咦什麼刪掉使用者?是指把發送訊息這個功能鎖起來嗎?
delightfullychaotic 21:04:02
delightfullychaotic 21:04:22
其實我也想要這件事情如何發生
bil 21:07:56
會先把行為模式留下紀錄(例如大量放送沒有道理的亂碼、機器人攻擊),放在facebook編輯公開社團和slack公開,然後鎖權限。
delightfullychaotic 22:31:39
後來發現要改的比我想像的少,很多其實當初都有寫,只是我們都忘了(包括我)
```Chatbot使用規範
https://docs.google.com/document/d/1-SHWpV8NBI5u79dhvJUjkDaCfBJ0cYxwXoV4sIxPzOo/edit#

編輯使用規範
https://docs.google.com/document/d/1hyoC9xEeKqvaKN5ahfyczUZCs2-j1a9mkg3qHQDcfK0/edit#```
youz 22:35:35
@chenyuzu1221 has joined the channel
lucien 22:53:56
來討論囉https://hackmd.io/dfAkGHLCShacnOoruGxr0w|https://hackmd.io/dfAkGHLCShacnOoruGxr0w

hackmd.io

「設計討論」需複查回應列表 - HackMD

mrorz 12:12:49
@lucien 我把探索 elasticsearch query 可能性的研究放進 hackmd 囉。

因為 Elasticsearch 的限制,其實我們無法在 query 的時候 (包含 sort by script, scripted field, scripted score 等等 context),去存取 `articleReplies` 裡的 nested object。硬去存取 `doc['articleReplies']` 只會造成 `No field found for [articleReplies] in mapping with types []` 這個 error。

> Ref: https://discuss.elastic.co/t/help-for-painless-iterate-nested-fields/162394/2
不過,用最新 `articleReply` 排序文章是完全沒有問題的,請見 hackmd 裡頭的 query 與 search result。

我在「複查」的現況是,會點開 https://cofacts.g0v.tw/articles?filter=solved 這個文章列表,但不足的地方是,他的排序是按照「文章被問的時間」而不是回應被加的時間,導致我不知道要看到哪一文章才算是「看完所有的新回應」;另外,我也要點開進去才能看到回應,很不方便。

因此,我覺得結合下面這些功能,對我來說就很有「需複查列表」的感覺:
• 現有的「已回覆文章列表」
• 預設用「最新回覆時間」排序(現有的 sort dropdown 新增排序選項)
• 同時在列表呈現訊息與最新回覆內文(新外觀)
以上是我的研究結果以及分享我的使用 scenario。我覺得定義「需要複查的訊息」的討論應該可以塵埃落定了,現在比較急迫的可能是如何在 UI 上達成「同時在列表呈現訊息與最新回覆內文」。
yajc44 13:28:06
如果把現在的列表轉換成card對網頁
yajc44 13:28:15
的loading會很大嗎?
yajc44 13:30:08
假設說在列表夠明顯展示訊息、目前的判定(是否含有不實)、最新的回覆摘要,是否能解你現在的問題?
lucien 13:31:05
我們會有獨立的頁面做文章及需複查的回覆聚合設計
yajc44 13:32:22
原來如此
lucien 13:33:35
卡片是可以考慮的,感謝分享
mrorz 14:00:53
@lucien :所以如果 @yanglin5689446 這個禮拜要實作,請問應該會是獨立頁面,還是我說的那種「現有列表、新排序方式」呢?

2020-02-06

CTWu 08:12:44
@neilctwu has joined the channel
foxfirejack 08:54:08
@foxfirejack has joined the channel
yanglin 09:50:00
@yanglin5689446 has joined the channel
yanglin 09:50:10
hi hi
JerryLin 13:59:04
@kc50047 has joined the channel
koko5823 17:01:06
@zzxxcc921012 has joined the channel
ash 20:20:28
@ashleyhsieh328 has joined the channel
wuulong 20:42:32
@wuulong has joined the channel

2020-02-07

reio 01:01:36
@reiokai has joined the channel
TANGCHENGLEE 01:03:14
@virgil246 has joined the channel
AlfieYFC 05:02:07
@alfieyfc has joined the channel
frank 09:15:29
@pacoou has joined the channel
cybai 09:42:05
@cyb.ai.815 has joined the channel
Jacky 09:47:12
@jong.shianns has joined the channel
FunnyQ 14:07:05
@funnyq has joined the channel
leira322 18:00:35
@leira322 has joined the channel
bil 19:21:59
嗨嗨嗨大家,cofacts明天有編輯小聚唷,還有本專案隨時都需要寫react.js和node.js的工程師還有公民查核十方大德,感謝大家加入這個頻道◉‿◉
yanglin 19:49:25
幾點哇
我可以去嗎?
bil 21:11:44
下午2點唷來來來
yanglin 21:12:30
兩點我可能有一點點緊繃 Q___Q
我以為傍晚 Q___Q
JustinLee 21:40:52
人不能到,但 node.js 跟 line bot 可以幫忙唷 XDD
bil 22:52:05
好唷好唷下次見xD

遠方的工程師(狂揮手)

2020-02-08

cai 09:04:43
@misa9063 has joined the channel
ronnywang 13:29:49
DSC_0168.JPG
ronnywang 13:30:13
今天供應兩包湯圓
tumi 15:37:28
超暖心湯圓小松:heart:
tumi 15:01:52
拍謝有好心人可幫開門嗎⋯⋯?
tumi 15:02:00
@1樓
ronnywang 15:03:18
可以按電鈴
ronnywang 15:03:20
我幫妳開
tumi 15:34:26
幫高調,今天編輯小聚有日媒來採訪:+1::skin-tone-2:
Image from iOS
ronnywang 15:45:53
繼續壯大(物理)社群
astroerin0407 17:12:32
@astroerin0407 has joined the channel

2020-02-10

John Huang 14:31:30
@little78926 has joined the channel
Yung 18:24:48
@yangchiyung12 has joined the channel
yanglin 18:43:44
想問一下
我在裝 `rumors-api` 環境跑 `npm install` 的時候
用 `node v13.5` 會 build fail
fail 原因是 grpc build 不起來
後來切換成 `node v10.6` 之後 build 完了
但是 `docker-compose up` 的時候會一直噴 error:
```Error: Failed to load gRPC binary module because it was not installed for the current system
Found: [node-v64-darwin-x64-unknown]
Expected directory: node-v72-linux-x64-glibc
This problem can often be fixed by running "npm rebuild" on the current system```
我想原因應該是我在外面 npm install 時會裝 osx 版本的 glibc
但是 container 吃 linux 版的
想問一下有沒有人遇過類似的狀況
mrorz 21:09:31
@yanglin5689446 對它壞了 QQ
請看看這個修它的 PR

https://github.com/cofacts/rumors-api/pull/145|https://github.com/cofacts/rumors-api/pull/145

GitHub

Fix dev setup by MrOrz · Pull Request #145 · cofacts/rumors-api

This PR updates README and docker-compose.yml so that it can docker-compose up without problem. cc/ @yanglin5689446 currently if you docker-compose up you may encounter error about gRPC binaries. T...

yanglin 22:17:00
喔喔感謝你~
mrorz 11:17:59
會 work 的話可以來個 approve XD
yanglin 11:18:19
好的
我等等看
mrorz 11:18:44
幫我按個喜歡
或者是按小喇叭訂閱 (?
yanglin 13:11:57
我切到這 branch 刪除 node_modules 重裝之後跑起來了
但是 localhost:3000 或 localhost:5000 還是拒絕連線
是 docker 還需要什麼設定嗎?
抱歉跟 docker 不太熟
yanglin 13:13:19
`docker container ls` 之後的結果
yanglin 13:53:44
懂了
mapping 到 docker-machine 的 ip
mrorz 16:45:18
Hmm 如果你用的是 docker for mac 的話,理論上 localhost:3000 或 localhost:5000 應該要有東西捏
yanglin 16:45:50
我用 docker-machine
host 在 virtual box vm 上 XD
yanglin 16:45:53
要從 host 連
mrorz 16:46:54
真 hardcore

2020-02-11

Derek T 09:55:46
@derek_tzeng has joined the channel
mrorz 13:07:56
@yanglin5689446 @lucien 我這個禮拜也是三四會在 Workis 唷
mrorz 16:45:45
明天 11am 開始會在 Workis
yanglin 14:20:45
hi hi 我明天再去 workis 跟你 sync
因為我發現明天晚上有活動 又我的口罩存量堪慮
想減少搭捷運的次數 XD
你明天下午會在 workis 嗎?
mrorz 14:49:15
會唷
mrorz 14:50:53
btw 疾管署針對捷運要不要戴口罩是這樣說
https://www.mohw.gov.tw/cp-4343-51410-1.html
yanglin 14:55:12
我大概知道
但是捷運搭比較久還是有點怕 ><
而且我同學說他感冒反而買不到口罩
還是會有點擔心會不會有人不健康(不一定是肺炎)在捷運上然後沒口罩可用之類的
總之我的想法就是盡量少出門然後搭捷運還是帶一下這樣
yanglin 14:07:28
@mrorz 可以給我這段說的資料嗎?
截圖 2020-02-11 下午2.06.55.png
mrorz 16:42:34
好哇明天
因為他很大 QQ
mrorz 16:43:15
我會建議你直接用 GraphQL playground 呼叫 CreateArticle API 塞幾個 seed data 進去
yanglin 16:46:30
我試試
不行的話可能明天去看看