cofacts

Month: 2017-11

2017-11-01

ttcat (not_staff) 01:14:44
請問明天晚上是幾點呀
ggm 13:57:08
我們都會到 11 點
ttcat (not_staff) 01:15:20
(8 點後到方便嗎?)
bil 09:05:30
方便唷
mrorz 11:16:35
今日會議預計討論事項 & 會議記錄:
http://beta.hackfoldr.org/cofacts/https%253A%252F%252Fhackmd.io%252Fs%252FB15v54U0Z

要彙整前幾次小聚的 TODO 好像內容有點多 w
mrorz 11:17:13
還有啥要提出討論的嗎
mrorz 11:17:40
例如說 node.js 全面升級到 8.9 LTS 之類的
ggm 13:08:17
不錯 這樣可以拆 babel 了嗎
mrorz 10:09:48
1. es6 module 要到 node 10 才會正式支援
https://stackoverflow.com/a/37132668
2. 有 babel 的話之後有機會可以加上類似 module-resolver 的東西,讓 `import xxx from '../../../oo/xx' ` 變成從我們設定的根目錄開始起算

我想到有 babel 與沒 babel 的差別大概在這裡
lucien 13:25:44
不行吧
lucien 13:25:57
Transform還是在babel
lucien 13:26:03
比如說JSX
ggm 13:56:20
ggm 13:56:22
我是指 chatbot
mrorz 14:15:14
chatbot 拆 babel 嗎
mrorz 14:19:00
好像可以
mrorz 14:19:17
你很嚮往不 transpile 的生活嗎
mrorz 14:21:47
如果你確定用不到 Javascript class properties (stage 3) 的話就可以拆 babel
http://kangax.github.io/compat-table/esnext/#node8_7
mrorz 14:22:10
其他的我也用不到 www
ggm 15:38:42
好像沒用到
delightfullychaotic 21:24:09
新:green_apple: 舊:apple: 半新半舊:pear:
mrorz 22:52:42
關於 title 的 ticket: https://github.com/cofacts/rumors-site/issues/52

GitHub

Change title / subtitle for SEO · Issue #52 · cofacts/rumors-site

As discussed in <http://beta.hackfoldr.org/cofacts/https%253A%252F%252Fhackmd.io%252Fs%252FB15v54U0Z> Using "真的假的" in google basically cannot find this project. We should try the following SEO techni...

sunrise91.t3 23:59:30
已發pull request!

2017-11-02

.michael_li 18:21:34
Gore Wang 我也是參加「新聞小幫手」的人 目前臉書專頁我在管 / 我是「新聞松」主辦人 你提出的一些概念 我之前在 NCC 開會有提過 也跟之前有個停擺的計劃「全民除霉計劃」有雷同 / 如果你願意的話 我人住在台北 我們可以見面聊一下

大家好,我是Gore。 曾經是假新聞受害者,昨晚在三創Coder Night分享自己的想對抗假新聞的一個平台概念之後,Lisa就跟我分享了這個專案,看了整個組織規劃乃至技術真的是都超厲害的啊~

sunrise91.t3 00:08:28
好耶,真的很想討論各種解法的可能性~
本週末因為JSDC我怕我晚上腦運轉低落,看下週的平日晚上(四除外)有沒有機會,or下週末也OK
.michael_li 18:35:24
順便提供我在「2017-03-30 NCC 推動網路新聞真實查核機制之諮詢會議議程」事先準備的講稿

https://michael_li.hackpad.com/lK3nuLw35Lm

大家好,我是Gore。 曾經是假新聞受害者,昨晚在三創Coder Night分享自己的想對抗假新聞的一個平台概念之後,Lisa就跟我分享了這個專案,看了整個組織規劃乃至技術真的是都超厲害的啊~

michael_li.hackpad.com

意見表述

---- 2017-03-30(四) NCC招開:網路訊息事實查核機制分享會 ---- Google Drive ---- / ## 「新聞小幫手」的發言討論 * 主要發言人:Michael_LI  //我不一定會發言,看情況。 * 發言內容:草稿先放在這邊-&gt;[意見表述](<https://michael_li.hackpad>.

ttcat (not_staff) 22:07:03
一位日本學生在找明年可來台灣參與 civic tech project 與 coummnuinty building 的機會,他會寫程式。時間約 5-6 個月,只需食宿。有興趣嗎?日本應該也很多 LINE....
ggm 00:54:31
好啊,不過只需食宿是什麼意思是我們要提供嗎 XDD 我們是沒辦法提供食宿 … QQ
ggm 00:55:27
我們是可以試著遠端合作看看?如果是單純寫 code 的話
ttcat (not_staff) 13:18:55
well, 如果你們有人家可以借住
ttcat (not_staff) 13:19:35
每個月食物補貼 ~10k 
ttcat (not_staff) 13:19:45
就有免費的工程師底迪了 :stuck_out_tongue:
mrorz 10:19:26
@ggm 感覺可以住 workis? XDD

2017-11-03

sunrise91.t3 00:08:28
好耶,真的很想討論各種解法的可能性~
本週末因為JSDC我怕我晚上腦運轉低落,看下週的平日晚上(四除外)有沒有機會,or下週末也OK
hychen 02:46:48
@hychen has joined the channel

2017-11-07

2017-11-08

mrorz 10:09:48
1. es6 module 要到 node 10 才會正式支援
https://stackoverflow.com/a/37132668
2. 有 babel 的話之後有機會可以加上類似 module-resolver 的東西,讓 `import xxx from '../../../oo/xx' ` 變成從我們設定的根目錄開始起算

我想到有 babel 與沒 babel 的差別大概在這裡

stackoverflow.com

NodeJS plans to support import/export es6 (es2015) modules

I've been looking all over the internet without a clear answer for this. Currently NodeJS uses only CommonJS syntax to load modules, and if you really want to use the standard ES2015 modules synta...

mrorz 10:43:03
我大概列了一下 11/8 今天的開會預計討論事項唷
https://hackmd.io/CwIwpghsDsAcCMBaaxgE5HAMwmo20WATIvACYTQQgRlEBmAbFkA=

一個是 @delightfullychaotic 提到的付費廣告
然後是小聚籌備,可能要大家回報一下邀請師傅的狀況,晚上應該要準備一些推播文案什麼的
然後 @bil 不知道今天晚上有沒有要看魚乾松的狀況呢?
對於對外聯絡的部分,可以 sync 一下與 LINE 的聯絡狀況,還有與其他組織接觸的形式
最後是我已經一個多月沒寫 release note 了,應該要把最近網站的變更記錄下來囧

hackmd.io

2017/11/8 會議記錄 - HackMD

bil 13:13:30
到期日是11月15號唷,看了一下篇數應該是還沒做完,還有一週嘛很夠很夠大家加油:D
hazelwei 20:06:21
嗚嗚嗚嗚魚乾松沒有魚乾
bil 22:19:26
一天25篇大家輕鬆回完~~
魚乾下週也不在嗎我以為老闆回來了
mrorz 14:45:23
@delightfullychaotic 可以在上面的會議紀錄補一下你想討論的「商業廣告」的例子唷
delightfullychaotic 14:48:21
好噢
sunrise91.t3 18:03:16
本日有事無法參加,但我會繼續解ticket的~

2017-11-09

mrorz 11:11:55
@ggm

我想要把 https://github.com/cofacts/rumors-line-bot/blob/dev/src/processMessages.js 拆成 `executeTransition.js` 與 `transitions/xxx.js`,其中 xxx 會是 `choosingArticle`、`choosingReply`、`askingReplyFeedback` 等等在做 state transition 的 function,unit test 也可以分開

GitHub

cofacts/rumors-line-bot

rumors-line-bot - Line bot that checks if a message contains internet rumor.

mrorz 11:12:49
然後因為參數有點多,我想要引入 typescript 之類的東西來做 static type check
type check 沒過的就 test fail 這樣
mrorz 11:15:59
會想這樣改是因為我想把我們的 state diagram ( http://beta.hackfoldr.org/cofacts/https%253A%252F%252Fdocs.google.com%252Fdrawings%252Fd%252F1GIuprSEGpthMW6KuCgawMky5Nnxm7P7mlxeODPdA-lI%252Fedit ) 弄得更 declarative 一些

但參考了 `Machina` 或 `javascript-state-machine` 之後,又覺得不用那麼複雜,一個針對 state 的 switch-case 來呼叫 function 就很足夠了,只是現在那個 switch-case 被放在很下面的地方,所以看不出來是個 state machine。

主要是麻煩在我們現在傳遞的參數(params,或稱作 context)太多,每個參數不知道在幹麻

2017-11-10

ggm 10:51:21
沒錯我也有這個困擾 我覺得不錯
.michael_li 12:23:16
以內容分析法探討網路上流傳之謠言 - JITAS Journal of Inform ation, Technol ogy and Soci ety 2002(1).pdf
.michael_li 12:24:14
我前幾個月有下載一篇論文 剛剛看到 順手分享
mrorz 13:22:46
之前有提到 LINE 的文章相似度,以及編輯界面「相關回應」的相似度參考價值頗低的問題。
我開了個 ticket 來記錄,技術方面的問題在 #general 發問了。
https://github.com/cofacts/rumors-api/issues/51

請問有人有用過 elasticsearch 的 highlighting 嗎? <https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-highlighting.html#_encoder> 跟 `more_like_this` query 合用在中文文件上的時候效果好嗎~? 是不是可以精確標出 search query 與 found document 所相同的句子或字詞呢?

GitHub

Show related paragraphs in search result, instead of the first paragraphs · Issue #51 · cofacts/rumors-api

Scenario LINE users seems not happy with the current "similarity" and tends to create new articles all the time. By showing the exact match of sentences may help them choose the identical article...

ronnywang 13:35:08
這邊用的就是 elasitcsearch 的 highlighting
mrorz 13:39:16
請問這個是用哪一種 highligher 呢?
(Plain / Postings / Fast vector / Unified)
mrorz 13:40:57
我拿了 Michel Li 的句子去 http://api.search.g0v.io|api.search.g0v.io 搜尋,搜尋語句:
```
這裡有一個「視覺化」「模擬核彈」的網站 很有趣 可以把自己輸入的參數 輸出特定網址
我輸入的是 美軍標準 B83 核彈 投射地點 台北市總統府大門口 爆破方式 空爆(影響範圍最大化)
```

標出來的 highlight 結果滿微妙的,有些標出來的東西看起來跟搜尋語句有點無關?
mrorz 13:42:09
綠色是 elastic search 的標記
mrorz 13:43:13
不過我覺得 good enough
mrorz 13:44:26
感謝 Ronny

2017-11-11

.michael_li 05:31:34
原來有這個東西 我每次都靠 Google 幫我搜 Logbot

我拿了 Michel Li 的句子去 <http://api.search.g0v.io|api.search.g0v.io> 搜尋,搜尋語句: ``` 這裡有一個「視覺化」「模擬核彈」的網站 很有趣 可以把自己輸入的參數 輸出特定網址 我輸入的是 美軍標準 B83 核彈 投射地點 台北市總統府大門口 爆破方式 空爆(影響範圍最大化) ``` 標出來的 highlight 結果滿微妙的,有些標出來的東西看起來跟搜尋語句有點無關?

2017-11-12

ggm 00:21:05

<https://meedan.com/en/check/> Meedan 這個組織做了一個服務 "Check" 方便大家進行新聞的查核,整合了一些方便的工具,像是以圖搜圖,還可以自訂 checklist 。專案在 github 上面 <https://github.com/meedan/check>

delightfullychaotic 15:01:51
這是挑釁嗎 LOL
https://cofacts.g0v.tw/article/AV-u3aFlyCdS-nWhui_x
mrorz 20:33:24
這 wwww
可惡啊超過 20 字擋不了 www
mrorz 20:34:37
不過 @bil 今天聊天的時候有跟我說,他覺得要有超過 2 人回報的謠言才算是有公共性、值得回應的訊息。

我覺得可以開一個過濾選項,只列出有 X 人回應的文章,然後 X 可以讓使用者自己選這樣
mrorz 20:35:02
但這要做完 mappings refactor ._.
ggm 23:05:00
我覺得 @bil 講的有道理,不過同一個使用者可能會傳兩次,這樣就通過了
ggm 23:05:30
所以可能還要再擋掉同一個人不能傳兩次一樣 (或是類似) 的文章
mrorz 00:17:06
that case should be handled with
delightfullychaotic 15:02:11
不知道是不是 LINE 的人
https://cofacts.g0v.tw/article/AV-u3JktyCdS-nWhui_w
.michael_li 19:13:30
以後這種情況會越來越多 只要越有名越會這樣 因為軟體系統(A.I.)無法在第一時間就知道這不是貼謠言
mrorz 20:33:24
這 wwww
可惡啊超過 20 字擋不了 www
mrorz 20:34:37
不過 @bil 今天聊天的時候有跟我說,他覺得要有超過 2 人回報的謠言才算是有公共性、值得回應的訊息。

我覺得可以開一個過濾選項,只列出有 X 人回應的文章,然後 X 可以讓使用者自己選這樣
mrorz 20:35:02
但這要做完 mappings refactor ._.
mrorz 20:38:45
然後關於小聚的時間如果要改成雙月的話
那是不是要與大松錯開比較好呢?
這個月剛好就是大松與小聚在相隔一週的時間 orz
mrorz 20:39:21
參考一下這是 2018 大松的預計時間

<@U7YPZHDSQ> 明年上半年大松預計時間:<http://hack.g0v.tw/> 接下來是五月、七月、然後可能就是十月 567 g0v Summit 2018

2017-11-13

mrorz 09:27:09
@ggm 請 review 一下這個 refactor:
https://github.com/cofacts/rumors-line-bot/pull/42

基本上除了把大檔案拆小之外沒做啥事
但之後要 Refactor 個別小 handler 會容易一點

GitHub

Refactor the huge processMessage.js by MrOrz · Pull Request #42 · cofacts/rumors-line-bot

As discussed in <https://g0v-tw.slack.com/archives/C2PPMRQGP/p1510197115000070> This PR renames processMessages.js to handleInput.js and splits input handlers in processMessage.js to handlers/xxx.js....

mrorz 09:28:00
晚上我會 merge 這個 PR 然後做
https://github.com/cofacts/rumors-line-bot/issues/41

現在 Duplicate 多到看了覺得煩

GitHub

Should not allow users to create new article that is 100% duplicate · Issue #41 · cofacts/rumors-line-bot

<https://cofacts.g0v.tw/article/AV-UPjsPyCdS-nWhuitc> <https://cofacts.g0v.tw/article/AV-UPjsKyCdS-nWhuitb> Expected: We should not allow users to say "這裡沒有我的訊息" in this case.

mrorz 13:55:07
記得報名~

<https://g0v-jothon.kktix.cc/events/g0v-hackath27n> 大松開放報名囉

delightfullychaotic 14:00:07
已報名
lucien 20:08:41
已報名
caasi 15:03:13
好奇這邊在用的 http://slackarchive.io|slackarchive.io ,有 API 可以查找 log 嗎?
ttcat (not_staff) 15:06:03
好奇 +1 如果是 private channel,紀錄會變公開的嗎?
mrorz 15:11:54
1. slackarchive 目前沒有 open source,也沒 open api 的樣子
https://slackarchive.io/

2. 只要有 invite bot 進去就會公開吧?
mrorz 17:59:22
我先改 rumors-site,rumors-line-bot 的部分我會先上 feature(比較急)再升級,rumors-api 有空再弄。

rumors-site 的 dependency change PR 求 review
https://github.com/cofacts/rumors-site/pull/55

例如說 node.js 全面升級到 8.9 LTS 之類的

GitHub

Upgrade NodeJS and deps by MrOrz · Pull Request #55 · cofacts/rumors-site

Note: Everyone should run npm install after this change! Drops yarn; use npm 5 Upgrades to React 16, Next 4 Updates Dockerfile Update all coding styles due to prettier update

ttcat (not_staff) 18:11:49
上次有說需要我這邊幫忙寫信去給 LINE?
mrorz 18:26:42
有的有兩件事情,但目前應該還沒有要幫忙寫信的部分唷

一件是以 ocf 名義申請 LINE@ 認證帳號,這個部分 ggm 已經寄一封主旨為「想請開放文化基金會幫忙申請 LINE 的認證帳號」到 <mailto:hi@ocf.tw|hi@ocf.tw> 囉

另一件事情是關於身為非營利組織與 LINE 尋求合作機會,這個部分目前也是 GGM 在聯絡,可能會再去 LINE 總部開一次會 ~聽說上次開會好像也是在 11 月⋯⋯ XDD~ 其實是今年 1/25
ttcat (not_staff) 18:28:36
收到,那我先處理 1
mrorz 18:22:00
@lucien 這次有要推播唷,文案在最下面:http://beta.hackfoldr.org/cofacts/https%253A%252F%252Fhackmd.io%252Fs%252FrkQZayeyG
lucien 20:07:39
能加可愛emoji嗎哈哈
lucien 20:08:20
圖片這次可以用大大的圖文訊息嗎
mrorz 11:10:53
20:00 前都可以改 emoji 唷
mrorz 18:22:04
但還沒決定要啥時推
mrorz 18:22:12
今晚 10pm 會太晚嗎?
bil 22:10:37
咦還沒推嗎?誰有推播權限
mrorz 11:10:27
sorry 昨天晚上幫我媽弄電腦所以忘記了 Orz
現在設定了今晚 20:00
ggm 19:03:40
嗨各位,我收到 LINE 的回應了,我的信件有 cc 到 <mailto:cofacts@googlegroups.com|cofacts@googlegroups.com>
ggm 19:04:16
他主要是給我們這兩個時段挑選
11/14 週二 4pm or
11/15 週三 5pm
mrorz 19:04:41
我 11/15 (三) 5pm 可以請假參與
上次有去過~
ggm 19:05:29
就~~決定是你拉~
bil 09:18:13
我也可以去,不過是不是滿了xD
ggm 12:25:44
糟糕我剛剛回了兩位,沒看到妳
ggm 12:26:01
沒關係明天妳就直接過去,我在跟宏哲打個招呼就好
mrorz 12:36:17
上一次其實人超多的 (au 辦公室也派了兩個人),這次四個人還算少的呢 XD
bil 13:25:07
耶咿謝謝ggm,其實上一次我也有去啦QwQ
ggm 19:05:08
我會過去,然後看有沒有人有興趣可以一同前往,我想大約控制在 3 人以內
ggm 19:06:15
那我就回信說 11/15 週三 5pm 囉!
mrorz 10:37:31
@ggm 我看到你的回信了
感謝協助 :D

不過如果他們沒有回音,要不要再寄信問一下他們,然後也提一下 @ttcat 也要出席的事情呢
ggm 11:23:07
有呀 他有回我 他發邀請了
ggm 12:20:05
LINE 有發邀請給我,然後我回了那封信,也把 @mrorz @ttcat 加進去囉
ttcat (not_staff) 12:27:57
Confirmed 我會去
mrorz 19:06:20
可以唷
mrorz 19:07:33
主要應該是談 LINE 這裡對非營利組織是否有什麼合作方案可以用
我們的需求就是推播這樣
不過我不確定我們可以提供 LINE 什麼東西做為合作的交換
ttcat (not_staff) 19:13:47
需要幫忙跟嗎
delightfullychaotic 19:54:55
我覺得這邊可談我們可以作為他們聊天機器人多元應用的 Case Study,另外也是假新聞議題的 Case Study。這是他們目前相較 Facebook 比較少的著墨點。
mrorz 20:05:01
@ttcat 有空的嗎?
之後 Cofacts 有點像是掛在 OCF 下與 Line 合作,我覺得如果阿端能參與的話比較能減少事後 sync 的 effort,可以的話感激不盡
mrorz 20:08:59
我覺得我們可能沒辦法給 Line 什麼 exclusive 的東西,因為無論是程式、設計還是謠言與回應資料都採用開放授權,即使不是 Line 也能運用。

但如果與 LINE 合作能促進收集更多的資料,加速累積訊息與回應,而 Line 又剛好對參考這樣的資料有興趣的話,那提供我們合作機會,對他們也是美事一樁。
mrorz 20:09:54
不過我這裡無法提出,合作之後我們可能比合作之前能加速多少的成長就是了 xD
delightfullychaotic 20:12:16
其實我本來想要下禮拜一去 LINE 參訪的主題設為假新聞,但是他們不想要XD 但我覺得我還是可以下個禮拜一的時候在參訪時候說,這是全球重視的議題,台灣政府也開始正視。算是你們鋪路,我再敲下去。
sunrise91.t3 21:32:50
交換的就是一個當LINE被假新聞議題纏上的時候,馬上就可以例證有所出力的實質名目哈哈
hazelwei 23:40:59
如果我們的查證可以提供他們轉換成不錯的content,增加使用者對line黏著度,會是不錯的誘因。是否需要幫忙整理我們產出內容對Line使用者,有實質幫助與黏著這塊?
mrorz 09:18:32
@hazelwei 好呀感謝 :D 不過我們明天下午就要去惹,來得及嗎 QQ

@sunrise91.t3 不過我們平台有很多指出 linetoday 含有不實資訊的地方 :speak_no_evil:
hazelwei 11:17:39
@mrorz 我整理一下,晚上弄好給你們喔!
lucien 21:38:31
Line 推播
delightfullychaotic 21:39:16
感恩鹿尋,讚嘆鹿尋
delightfullychaotic 21:39:48
🦌🦌🦌🦌🦌🦌🦌🦌🦌
bil 21:50:16
嗨咿從9月6號開始進行到11月15日,魚乾松歷經70天的日子也差不多該到尾聲了。希望大家魚乾200的文章回應都能順利完成=D

https://docs.google.com/spreadsheets/d/1rjbONUZwaZmd2KVOehhkf7NhhaREnwj4hB7fhPwEEJY/edit#gid=1061711687

禮拜三互相關懷喔,感恩。
(現在總文章數是11008,比起遊戲開始9320當時也增加了1688篇呢,總算是個普通的2%了)

2017-11-14

@null 10:23:53
@mrorz commented on @lucien’s file https://g0v-tw.slack.com/files/U03HEDMJQ/F7YPHM9MF/line.png|Line 推播: 這次可以做圖文訊息了呢
我發現這張圖是 1041x1041
所以我調一下唷
Line 推播
@null 10:24:15
@mrorz commented on @lucien’s file https://g0v-tw.slack.com/files/U03HEDMJQ/F7YPHM9MF/line.png|Line 推播: 大家覺得今晚 20:00 推播如何呢
Line 推播
@null 10:47:09
@lucien commented on @lucien’s file https://g0v-tw.slack.com/files/U03HEDMJQ/F7YPHM9MF/line.png|Line 推播: 咦咦默默多了1px
Line 推播
mrorz 10:48:00
剛才我送給 all administrators 一個 test message
mrorz 10:48:37
只有 Administrators, Operations personnel, and Operations personnel (no statistics view) 看得到
lucien 10:50:08
喔喔
mrorz 10:50:10
用了這個功能
ttcat (not_staff) 11:07:06
正在喬時間,待 confirm
@null 11:18:19
@hazelwei commented on @mrorz’s file https://g0v-tw.slack.com/files/U039CG5S7/F7ZSYCQ8M/_____________2017-11-14_______10.48.19.png|用了這個功能: 哦哦哦哦哦哦原來是測試orz那我懂了!!!
用了這個功能
darkbtf 17:10:27
在聽的一門深度學習課有同學的 final project 要做假新聞預測
mrorz 17:40:10
喔喔原來是有一組要做
我以為是老師推薦大家做 @@
darkbtf 17:40:43
八卦一下好了 HTC 有提供兩組有獎金的題目
mrorz 17:40:56
題目嗎
mrorz 17:41:03
是什麼題目
mrorz 17:42:19
https://www.kaggle.com/mrisdal/fake-news/data
這個 dataset 是任意人都可以發布的嗎?

kaggle.com

Getting Real about Fake News

Text &amp; metadata from fake &amp; biased news sources around the web

darkbtf 17:43:21
就兩個他們自己研究做的相關題目
darkbtf 17:43:41
一個是ARVR相關的 一個是醫學影像相關的
mrorz 17:43:46
okok
mrorz 17:44:14
是說那個 kaggle 的 dataset,哪個是 prediction label 呀
darkbtf 17:44:18
dataset是任何人都可以發佈沒錯
mrorz 17:44:58
type 怪怪的呀,type 是根據 B.S. Detector 在做,但 B.S.detector 是根據 site host 來評分的 http://bsdetector.tech/
darkbtf 17:45:34
嗯對啊
mrorz 17:45:40
如果拿 type 來做的話,那你最後會 train 一個 site_url 權重極高的 classifier
mrorz 17:46:12
感覺我們的 dataset 有意義很多
希望之後可以放到 kaggle 上給大家玩
darkbtf 17:46:20
好像不錯 XDD
mrorz 17:47:05
因為「原來差不多這樣品質的資料就可以放上 kaggle」感到放心
darkbtf 17:47:35
都可以放啊
darkbtf 17:47:43
有沒有人理你的差別 不過他有 featured
mrorz 17:48:00
可能是跟 kaggle 談的
mrorz 17:48:28
或許我們放我們的資料之後也可以跟 kaggle 談談
mrorz 17:48:42
但先等我們生出 export script 吧⋯⋯
darkbtf 17:48:46
其實很多 featured dataset 也沒什麼人按讚
darkbtf 17:48:53
應該是談的沒錯…
darkbtf 17:49:03
mrorz 17:56:13
其實 public dataset repo 還挺多的
https://datascience.stackexchange.com/questions/155/publicly-available-datasets

datascience.stackexchange.com

Publicly Available Datasets

One of the common problems in data science is gathering data from various sources in a somehow cleaned (semi-structured) format and combining metrics from various sources for making a higher level

mrorz 17:56:17
但我只聽過 kaggle
mrorz 17:57:32
是說你覺得這門課的教授會對我們的 dataset 有興趣嗎?
或許可以請教授推薦我們放到什麼地方,是學術圈會常用的
mrorz 17:57:50
kaggle 感覺就是比賽用的,學術圈可能不一定會用 XDDD
mrorz 17:58:55
或者是如果我們做好 dataset
教授喜歡我們的 dataset
說不定可以幫我們推薦進 kaggle 的 featured data set 或其他學術圈會用、但需要審核步驟的 dataset repo
darkbtf 18:15:26
我去問問好了
darkbtf 18:15:35
其實我應該一開始就叫我朋友提這個的
darkbtf 18:15:47
結果當時我沒想到我們的可以用
darkbtf 18:15:49
QQ
darkbtf 18:17:36
看了一下 kaggle 上面那個有 17萬筆
darkbtf 18:17:53
我們目前是 11k
darkbtf 18:18:02
不過我們資料品質比較高
darkbtf 18:18:05
高滿多的 XD
darkbtf 18:23:41
是說一般人是怎麼知道我們的
darkbtf 18:24:31
剛剛搜 真的假的 line
darkbtf 18:24:39
Pasted image at 2017-11-14, 6:24 PM
darkbtf 18:24:43
該說數位時代的 SEO做太好嗎
mrorz 19:28:37
一般人只能靠新聞與口耳相傳吧
mrorz 19:28:45
現在的應該都是當初的 16000 人的自然膨脹
ggm 20:20:32
其實可以寫信去數位時代 叫他們改個標題 XD
ggm 20:20:37
更正內文之類的
delightfullychaotic 21:08:54
需要的話,我可以來處理一下~~~~~
delightfullychaotic 21:09:01
我猜 @hazelwei 應該也可以XDD
hazelwei 21:14:00
都可,如果 @delightfullychaotic 比較熟,那可能速度會更快XD
delightfullychaotic 21:17:58
我們下禮拜再處理,他們現在應該 Meet Taipei 全員崩潰中,不好說
mrorz 22:31:36
@ggm 明天與 LINE 報告是你這裡會報嗎~?要不要幫你整理數據呢
ggm 00:25:03
對我來報,應該是不用特別整理數據,我可以沿用上次在 Google 報的那次,然後再用一下 Botimize 現成的數據就好

2017-11-15

hazelwei 00:19:00
我簡單列了一些數字跟對讀者有用的案例。
有需要請說~也有提供PDF版本。
真的假的_x_LINE_合作.key