echo-mori

Month: 2019-07

2019-07-20

awan / 阿旺 11:19:23
@kindalu has joined the channel
awan / 阿旺 11:19:24
@kindalu set the channel purpose: https://github.com/wangchou/echo-mori
York 11:21:33
@tcssh611503 has joined the channel
aaron 11:22:04
@wise.rong has joined the channel
aaron 11:22:34
Hi, I'm here
awan / 阿旺 11:22:40
Hi<
simon 11:23:05
@simon has joined the channel
simon 11:23:10
Hi
York 11:23:28
HI
awan / 阿旺 11:23:31
今天希望能夠有簡單的編輯功能,然後上到 google server
awan / 阿旺 11:23:42
和 UI 流程。
awan / 阿旺 11:24:26
希望 JS 工程師可以先跑起來環境
awan / 阿旺 11:30:20
看可不可以開
aaron 11:31:23
可以開,但沒內容
Mars / Kevin Chen 11:38:33
@flyingmars has joined the channel
Mars / Kevin Chen 11:38:58
hi 大家好
fly 11:41:40
@leo424y has joined the channel
awan / 阿旺 13:11:09
module.exports = 'AIzaSyAIvUSdGkVXYj3vK-dEYC3VjmvmOUFxapE'
awan / 阿旺 13:11:43
google tts api key
ilovef1001 13:37:42
@ilovef1001 has joined the channel
ilovef1001 13:38:31
/
Image from iOS
simon 14:36:05
對了,aahsu和我這20句中英對應,是從龍騰出版社的高中英文課本前三課來的。要提醒使用者別侵權,或者我再想其他沒有版權問題的句子好了。
aaron 15:53:01
<mailto:wise.rong@gmail.com|wise.rong@gmail.com>
stella 17:17:26
@stella has joined the channel
stella 17:17:48
Hi
awan / 阿旺 17:18:13
demo 影片
IMG_8959.MOV
kkpan11 17:44:08
@kkpan11 has joined the channel
grass 17:44:15
@grass has joined the channel
chihao 17:48:55
@chihao has joined the channel
chihao 17:49:42
哈囉哈囉,建議把討論過程和進度記錄在 https://g0v.hackmd.io/ 這裡喔,這樣更多社群的人更方便讀 :slightly_smiling_face:

HackMD

HackMD - Collaborative markdown notes

Best way to write and share your knowledge in markdown.

fly 18:00:54
想參加定期聚!麻煩再提供資訊
trello 19:48:21
@trello has joined the channel
simon 22:23:45
我想到這讀句子功能,若能加上文字辨識,做成掃描筆的應用,會更方便,也不用建中英對照句庫了 哈哈
simon 22:40:28
這樣一想,記得手機上的Google translate app好像有你這個讀句子的功能耶...
awan / 阿旺 22:52:34
我沒用過掃瞄筆,學校的學生和老師可能也和我一樣。讀句子的功能都是 Google 提供的,系出同源~ 沒錯,是一樣的 :deciduous_tree:
awan / 阿旺 22:54:07
@kindalu set the channel topic: https://g0v.hackmd.io/OAq3-ouBTBScLk7TOYCQtg

2019-07-21

awan / 阿旺 00:55:39
https://echo-mori.com/ 剛上線了 (:warning: 只支援 Desktop Chrome &amp; Android Chrome)
預計,明天才會加錯誤訊息 XD
awan / 阿旺 00:56:56
如果有碰到問題、請上 trello 回報 (點 channel 列的網址 可以前往)
awan / 阿旺 10:44:12
關於,下次聚會。坑主平常上班到 19:00,所以想約平日晚上8點、或週末早上10點。(週末想避開人,只能約早一點)
時間:8/3 - 8/4 早上10點 (六日), 8/5-8/9 晚上8點 (平日)。
地點:公館捷運站 附近的 漢堡王3F (https://goo.gl/maps/A62PyHzSAj7FRpwE6)
---
8/3點 :six:,8/4點 :seven:。8/5 - 8/9 請點 :one: - :five:。統計到這週五。
stella 17:43:04
時間還不確定 :joy:
stella 17:43:28
到時會有小聚的會議記錄嗎?
awan / 阿旺 18:10:18
我會開一個投影片,請大家把想討論的列上去。可能把決議寫在註解。我看 PM 是這樣做的。
awan / 阿旺 20:01:48
回音森林口說讀書會
1. 利用這個網站、提升所有成員的英文口說能力
2. 短期目標:準備在下一次大松,提升100個人的口說能力。(一個人十分鐘?)

自己用都不能進步的系統,其他人大概也不會想用吧
以這個為方向,設計網站吧
可能要有一個人假裝老師、還有一群人假裝學生 XD
-
PS: 工程師只能每週貢獻12小時寫程式。很少,功能可以多,但希望網站的設計是簡單、沒有華麗 UI 的。

大家覺得這想法如何?
stella 10:12:57
100人!感覺很挑戰 XDD
awan / 阿旺 12:50:03
那目標下調到,30人,分三組。會後持續使用一週。這樣子如何?
aaron 20:43:01
本身也想提升口說能力
_quote: 自己用都不能進步,其他人大概不會想用_ ))) <點頭如搗蒜>

2019-07-22

awan / 阿旺 09:55:58
感受到大家週末都沒空的氣氛,增加了平日晚上的選項。聚會時間,請大家再投一次票。

2019-07-23

2019-07-27

ilovef1001 09:48:56
請問8/5可以嗎?我忘記我那天有事情 所以有投那天 不好意思
awan / 阿旺 10:05:41
現在8/5(一) &amp; 8/7(四) 都是四個人。有人這兩天,還沒投票想投的嗎?
延長投票時間到今晚12點,如果,都沒有人投的話就 8/5 喔
awan / 阿旺 10:06:52
仔細看投票細節,大家的時間真的很分散啊…

2019-07-28

awan / 阿旺 09:59:34
第一回聚會
時間:8/5(一) 20:00
內容:請見 Trello (https://trello.com/b/kbIiQrxJ/回音森林-echo-mori)
地點:公館的漢堡王 3F (https://goo.gl/maps/A62PyHzSAj7FRpwE6)
-
PS: 會寫會議的討論事項 &amp; 總結,給不能來的朋友。

google.com

Google Maps

Find local businesses, view maps and get driving directions in Google Maps.

awan / 阿旺 13:23:21
明天起,每週一 20:00 ~ 21:00。我都會在公館漢堡王 3F。歡迎來聊天 or Slack 連線參戰。

上三樓後右轉,應該會看到下圖 + 加上坑主一個人。
-
PS:冷氣很強!
Image from iOS
awan / 阿旺 13:29:50
@kindalu set the channel purpose: 外語的口說能力為民生必需品,這個計畫,希望大家都能以很少的代價得到它。
awan / 阿旺 13:30:30
@kindalu set the channel purpose: 外語的口說能力為民生必需品,回音森林計畫,希望大家都能把它輕易入手。
aaron 14:45:07
大俠都需要的民生必需品

2019-07-29

York 20:30:58
安安 線上參戰在這邊(?
awan / 阿旺 20:31:47
安安
awan / 阿旺 20:32:14
目前在報告一週不寫 code
awan / 阿旺 20:32:36
都在生 user story... 設計
awan / 阿旺 20:32:53
還有徵翻譯人
awan / 阿旺 20:34:04
據說有六萬簡中 <-> 英文翻譯。目前希望下週前可以翻200句成繁中,並分成十類。
York 20:44:53
我找人看看0.0
awan / 阿旺 20:48:46
@ilovef1001 說8/3他們國中同學會,會弄一版50句的,試看看大家想法。
awan / 阿旺 20:49:20
說不定當天,還有英文老師~
awan / 阿旺 20:50:47
user story 跟有點亂的架構圖第一版 都放在 hackmd 上了
awan / 阿旺 20:51:21
不過架構圖會重新設計,有遊戲化風和社交風兩個方向。
York 21:03:01
了解,辛苦了
kuruma 21:12:29
@j6gjvm00 has joined the channel
kuruma 21:18:08
大家好
awan / 阿旺 21:23:41
你好~ 剛剛會戰已結束 XD
awan / 阿旺 21:24:35
晚一點會寫 weekly report。下一次聚會,下週一喔
kuruma 21:25:13
我是軒,目前在一間財經公司擔任PM,剛加進來,還有點搞不清楚狀況。
kuruma 21:25:58
好唷!有看到好像每周一晚上公館漢堡王是大家的約會地點?XD
awan / 阿旺 21:26:09
主要資訊都在標題的 hackmd
awan / 阿旺 21:27:06
我們需要 PM,坑主只會寫 Code。大歡迎~
aaron 21:35:09
大歡迎 )))
aaron 21:38:22
@kindalu 如何解決?手機上開啟的狀況
Screenshot_20190729-213641.png
awan / 阿旺 21:45:46
我試著轉成 pdf 看看
awan / 阿旺 21:47:36
awan / 阿旺 21:48:01
PS: 這不是最終版喔。還在修正
aaron 21:54:35
I see, thanks
awan / 阿旺 22:05:43
https://echo-mori.com/ 網頁版也 fix 了。不行再跟我說~

2019-07-30

Casey Huang 07:53:47
@caseysiethy has joined the channel
Casey Huang 07:58:15
大家好~我是高中英文老師
Casey Huang 08:00:46
可以幫忙錄音or翻譯的部分
awan / 阿旺 08:19:09
老師好,現在還在很早期的實驗階段。這週會需要,大概 1 ~ 200句子,每十句為一組。希望每組都是同類的。
awan / 阿旺 08:19:40
目前句子都是自行尋找,像是這個資料庫 https://tatoeba.org/eng/sentences/search?query=&amp;from=eng&amp;to=cmn
awan / 阿旺 08:21:25
其實比較想知道的是,google 的語音辨識、語音合成的技術夠不夠幫忙學生學習。
awan / 阿旺 08:23:00
awan / 阿旺 08:24:21
想請你點上方「回音森林」的連結,然後點連結試看看辨識和合成。如果語音合成夠好的話,就先用 Google 的技術。
awan / 阿旺 08:24:43
最後,歡迎你加入 :deciduous_tree:
Stephanie / 鍋鍋 13:45:01
請問找句子是要找什麼樣的句子?Tatoeba那個好像大多數是單字?
awan / 阿旺 13:48:49
tadoeba 都是句子喔。目前只是找分類句子。內部開發測試版用的,像是旅遊、打招呼、聊天氣、問路…
Stephanie / 鍋鍋 13:49:47
這是我看到的畫面,你那邊有沒有比較理想的範例XD?
https://tatoeba.org/eng/sentences/search?query=&amp;from=eng&amp;to=cmn&amp;page=7
awan / 阿旺 13:52:59
加上搜尋就會出現正常點的句子。
awan / 阿旺 13:53:23
上班中 先回去潛水…
awan / 阿旺 13:55:00
歡迎鍋鍋。
Stephanie / 鍋鍋 13:55:26
了解了,那我從日常生活用語開始吧。像是這個:
https://davytw.pixnet.net/blog/post/6115305-%E5%B8%B8%E7%94%A8%E8%8B%B1%E6%96%871000%E5%8F%A5
(嗯?好像複製貼上就完成任務了)
Stephanie / 鍋鍋 13:56:39
啊啊我懂了,要把Tatoeba的數據全部拷過來翻譯成台灣中文對吧
Stephanie / 鍋鍋 13:56:47
我來開個google sheet
awan / 阿旺 13:57:44
先別火力全開啊。有分類兩百句就好。
awan / 阿旺 13:58:07
Tadoeba 是 CC License 的所以都能用
Stephanie / 鍋鍋 13:59:50
今天先把基礎建設架好XD
Stephanie / 鍋鍋 14:02:23
是不是寫個python把資料全部撈下來再tag比較快?
awan / 阿旺 14:03:20
其實網路上有人 還是官方有人做了
awan / 阿旺 14:03:55
不過我要先潛水, 解 bug 中。
Stephanie / 鍋鍋 14:04:08
沒事,我研究一下
awan / 阿旺 20:27:47
http://opus.nlpl.eu/Tatoeba.php 這邊有雙語對照分好,找 en-cmn 的下載就對了
awan / 阿旺 21:09:57
在 Trello 上開了一張票,assign 給 @yckuo 鍋鍋了。不是要你一個人翻喔,是希望你主導一下。:P
Peiwen 10:43:11
@pw0224 has joined the channel
kNoel 11:08:50
@b00202070 has joined the channel
Stephanie / 鍋鍋 13:37:26
@yckuo has joined the channel
Stephanie / 鍋鍋 13:41:17
大家好我是鍋鍋,現在在矽谷做UX design。可以幫忙英日文翻譯和幫忙做UX相關的research, UI review等等。我很方便的 :+1:
不過目前只能remote~~~
Stephanie / 鍋鍋 13:48:26
對了,因為remote加上時差的關係,希望能給我明確的指示要做什麼事情會比較有效率。請多指教了 <O>
stella 13:49:27
謝謝加入~ :boogie-penguin:
awan / 阿旺 21:26:38
我卡在這兩個問題,不知道設計師們有沒有什麼想法? (on Trello)
Stephanie / 鍋鍋 01:08:29
1. 讓貢獻這件事情也遊戲化。比如說每日登入獎勵,可以問他們一個問題,說在這種情境下(可以是很好笑的情境)你會回答什麼?有回答就多積分十分之類的XD
然後放個每日貢獻排行。
之前用滬江網校的時候,每天登入可以換0.1虛擬幣,虛擬幣可以折抵付費課程,我那時候每天都超認真上線XD
2. 就我自己的經驗來說,我覺得社交需求倒是其次。但如果遇到問題的話有人可以協助倒是很好。論壇功能可以放在產品成熟之後,MVP可以先不用有論壇。
awan / 阿旺 07:05:07
“虛擬幣可以折抵付費課程” 這點看起來很有用啊。

1. 網站不會收費,但可以考慮加上學習限制,每天只能學100句。但貢獻句子可以增加每日quota之類的。
2. 排行榜好像不錯
3. 社交需求先忘記它,如果有 UX 研究的支持才考慮放回來
York 21:53:02
感謝各位朋友被我推坑,阿替目前的功能就是不斷地推坑朋友(誤
awan / 阿旺 21:54:21
給我你的 Github 帳號。幫你加入 collaborator 吧 XD
awan / 阿旺 21:59:33
邀請了,不知道哪邊會收到通知。
chongfong 21:58:32
@wl00796865 has joined the channel
chongfong 22:01:16
大家好~我是被阿替學長推坑的其中一人~~
目前還在瞭解狀況
有日文需求歡迎呼叫我~~:joy:
awan / 阿旺 22:05:44
上面是用 Siri 的服務,網頁版會用 Google 的服務

2019-07-31

Stephanie / 鍋鍋 00:52:16
我把Tatoeba的中英語料庫撈出來了,有124000筆,我正在試著把tag加上去。但我寫的python不太好,資料筆數太多跑不完,等待強者幫忙 :joy:
stella 01:40:08
Tatoeba 是免費的語庫嗎?
awan / 阿旺 06:51:26
CC-BY 和部分 CC0。Tatoeba 語料酷的目的就是提供給其他人開發語言學習軟體。
https://tatoeba.org/cmn/downloads
awan / 阿旺 06:52:40
是說矽谷的 UX Designer 都要會寫 Python 嗎?
Stephanie / 鍋鍋 10:03:01
沒有,只是學校必修 :joy:
stella 10:17:29
好強喔!
Stephanie / 鍋鍋 00:56:22
晚點來試試用sql
Stephanie / 鍋鍋 00:59:28
我想做成一個欄位是:
id, eng, cmn, tag的表格
這樣就只需要review中文翻譯,以及還沒有中文翻譯的句子,並且可以依照類別分工。
awan / 阿旺 07:30:07
剛剛看到 Anki 有整理篩選掉 tatoeba上,可能會有錯誤、和有髒話的部分 XD 想說用這邊的會不會比較好?
http://www.manythings.org/anki/
awan / 阿旺 07:32:13
官方有中譯的英文句子有59,000句。Anki 整理完剩21,000句。
Stephanie / 鍋鍋 09:41:32
不過缺點是沒有tag要自己tag XD
Mars / Kevin Chen 09:42:56
原本的59000句是有TAG的嗎?如果有的話比對一下就行了?
Mars / Kevin Chen 09:44:54
(顯示為看不懂59000那邊怎麼下載TAG)
更新:我看懂了:joy:
Mars / Kevin Chen 10:02:42
提問:hand:
@yckuo 提供的那個 Tatoeba 中英語料庫csv,與網站上的一樣嗎?
Stephanie / 鍋鍋 10:03:59
是的,是從Tatoeba的資料庫裡撈出來,然後只留下中英文
Mars / Kevin Chen 10:06:16
那我想問的是,這個檔案裡面中文跟英文的對應關係是?還是說如果要找這個檔案裡面任一句子的翻譯,要去另一個地方找?

我剛才翻了一下,好像沒有看到有翻譯的感覺?
Stephanie / 鍋鍋 10:07:49
Tatoeba的dataset是用ID, one to many(?)
Stephanie / 鍋鍋 10:08:07
如果是同一句翻譯,中英文是同一個ID。
Stephanie / 鍋鍋 10:08:28
每個ID也都有一個tag,在另外一個檔案裡
Stephanie / 鍋鍋 10:09:32
但是anki的檔案裡沒有留下句子的ID,所以有點GG。
Mars / Kevin Chen 10:13:51
感謝說明 :+1: TAG 那邊如果句子完全一樣的話,我可以幫忙上 ID。

但是我在你提供的檔案裡面好像沒看到任兩句有一樣的 id ? :thinking_face:
Stephanie / 鍋鍋 10:14:19
什麼!!!!(崩潰)
Stephanie / 鍋鍋 10:15:34
那還是直接用anki的檔案回去對應Tatoeba的句子,再找ID,再用ID對應回tag Orz?
Mars / Kevin Chen 10:17:35
好像可以,我試試看照你提供的想法 id, eng, cmn, tag 的表格輸出

另外一個 ID 可能應該也是一對多 TAG
Stephanie / 鍋鍋 10:17:56
應該是~麻煩你了 <O>
Stephanie / 鍋鍋 10:18:39
或是照tag分成不同檔案也可以,如果檔案誇張大的話
Mars / Kevin Chen 10:19:22
如果一句有多個 tag 的話,你覺得怎麼呈現比較好呢?我還蠻確定一句有多個 tag 的(像ID = 843583)有至少三個 tag
Stephanie / 鍋鍋 10:20:10
好問題!
Stephanie / 鍋鍋 10:23:48
解1: 分成另外一行?如果有三個tag就重複那筆資料三次?
解2: 在不同的tag檔案裡都有相同的句子?
-> 缺點是不同人翻譯的話可能會有不同的翻譯
解3: 每多一個tag就多一列
-> 在用tag分檔案的時候會比較困難
Mars / Kevin Chen 10:25:53
想要一個句子只有一個 tag,有什麼特別的原因嗎?
Stephanie / 鍋鍋 10:26:58
我原本是想分工的時候可以用tag來區分,一個人負責一個tag。
不過現在想想應該由句子為單位會比較簡單,等大家翻譯完之後後端再用tag整理。
Stephanie / 鍋鍋 10:27:23
那就多一列吧~~
Mars / Kevin Chen 10:35:09
以資料庫的觀點,因為句子跟 tag 是多對多,到時候存的話應該會像目前 tatoeba 一樣,把 ID 跟 tag 的對應分到另一張表?

所以你的考量是翻譯分配時的便利性,對嗎?
Stephanie / 鍋鍋 10:35:35
是的!
嗯嗯,資料庫這樣設計很合理。
Mars / Kevin Chen 10:39:45
抱歉我認真工作一下:joy:
等等回來研究一下怎麼從語料庫撈中英翻譯
Stephanie / 鍋鍋 10:41:09
感謝你~~~~:tada:
Mars / Kevin Chen 12:30:51
我剛才用程式跑了一下直接載下來的語料庫 ( http://downloads.tatoeba.org/exports/sentences.tar.bz2 ),發現他每一個 ID 都不一樣耶
Stephanie / 鍋鍋 12:33:20
…………………………
Stephanie / 鍋鍋 12:33:44
那,我們就直接用anki吧XDDDDD
Mars / Kevin Chen 12:57:57
像是 anki 表的最後一句的英文是1230633,簡中是1205914
Mars / Kevin Chen 12:58:09
我覺得我們應該是少看了一個表
Stephanie / 鍋鍋 12:58:13
挖賽你已經撈出來了好猛
Stephanie / 鍋鍋 12:58:20
有可能
Mars / Kevin Chen 12:59:15
不過既然中英都有對應的 ID 了,抓到 TAG 應該不是問題 (吧?)
Stephanie / 鍋鍋 12:59:56
應該吧,現在我真的搞不懂他資料庫是怎麼設計的了XD
Mars / Kevin Chen 13:01:27
那我下午來對應一下,話說你那邊應該半夜十二點了?
awan / 阿旺 13:03:55
他 Tag 有那些東東啊?
Stephanie / 鍋鍋 13:09:35
tongue twister, question and answer, time, appreciation, male speaker
Stephanie / 鍋鍋 13:10:10
咦跟我想像中的像英文課本那樣照旅遊天氣之類的分類有點不太一樣
Stephanie / 鍋鍋 13:10:30
還是我們就先用Anki開工,然後手工tag?
awan / 阿旺 13:17:56
好啊 我下班後再參戰。好像可以加簡繁轉換後的欄位 方便複製
Mars / Kevin Chen 13:41:16
為了預防有些資料將來可能會用到,我欄位想訂成
```
[英文][簡中][繁中(留白)][手動TAG(留白)][英文ID][簡中ID][英文TAG][中文TAG]
```
然後 tag 的部份以
```
maths,saying,syallabus
```
這樣呈現tag list ,大家覺得如何?
Stephanie / 鍋鍋 13:44:43
覺得很棒!
我來製作一個可能可以使用的tag範例表,讓大家手動tag的時候比較有方向。大家覺得有哪些建議的tag可以放進來呢?
Mars / Kevin Chen 13:48:05
我們手動的 Tag 是要照情境,還是要照難度?但是照難度的話分類的人好像要對現行教材有所了解?
Stephanie / 鍋鍋 13:54:14
感覺也跟未來教材要怎麼分類有關係,我at個高中英文老師 @caseysiethy
Stephanie / 鍋鍋 13:57:11
嗨~ @caseysiethy 我們在討論句子的tag應該要有哪些建議的選項。要依照情境,或是難度,你有沒有什麼想法?
這也許會和未來的教材有關係。比方說要讓他們選擇情境(像是旅遊、求職、面試、聊天等等),來練習對話。或是依照現有的國高中教材程度來選擇?或是考試類型等等?
Mars / Kevin Chen 13:58:41
我手先把手頭上的緊急事件處理一下,等一下回來開始整理語料庫 :joy:
話說 @yckuo 你不去休息嗎,那邊應該很晚了?
Stephanie / 鍋鍋 13:59:38
我這邊十一點,正在悲慘改作品集中 :cry:
Casey Huang 14:40:00
如果TA是國高中學生的話
就要先分成情境之後,再跟著學校教材的文法&amp;單字進度
比如說旅遊再細分成國中一、二、三年級範圍 高中也再細分成一、二、三年級範圍


TA是成人自主學習那種的話
直接依情境分,再由簡單往上排到難的即可
(可適用TOEIC GEPT TOEFL 都行)