echo-mori

Month: 2019-07

2019-07-20

Awan / 阿旺 11:19:23
@kindalu has joined the channel
Awan / 阿旺 11:19:24
@kindalu set the channel purpose: https://github.com/wangchou/echo-mori
York 11:21:33
@tcssh611503 has joined the channel
abyss 11:22:04
@wise.rong has joined the channel
abyss 11:22:34
Hi, I'm here
Awan / 阿旺 11:22:40
Hi<
simon 11:23:05
@simon has joined the channel
simon 11:23:10
Hi
York 11:23:28
HI
Awan / 阿旺 11:23:31
今天希望能夠有簡單的編輯功能,然後上到 google server
Awan / 阿旺 11:23:42
和 UI 流程。
Awan / 阿旺 11:24:26
希望 JS 工程師可以先跑起來環境
Awan / 阿旺 11:30:20
看可不可以開
abyss 11:31:23
可以開,但沒內容
Mars / Kevin Chen 11:38:33
@flyingmars has joined the channel
Mars / Kevin Chen 11:38:58
hi 大家好
fly 11:41:40
@leo424y has joined the channel
Awan / 阿旺 13:11:09
module.exports = 'AIzaSyAIvUSdGkVXYj3vK-dEYC3VjmvmOUFxapE'
Awan / 阿旺 13:11:43
google tts api key
ilovef1001 13:37:42
@ilovef1001 has joined the channel
ilovef1001 13:38:31
/
Image from iOS
👍 1 😎 1
simon 14:36:05
對了,aahsu和我這20句中英對應,是從龍騰出版社的高中英文課本前三課來的。要提醒使用者別侵權,或者我再想其他沒有版權問題的句子好了。
👌 1
stella 17:17:26
@stella has joined the channel
stella 17:17:48
Hi
Awan / 阿旺 17:18:13
demo 影片
IMG_8959.MOV
👍 1 🔊 1 1
kkpan11 17:44:08
@kkpan11 has joined the channel
grass 17:44:15
@grass has joined the channel
chihao 17:48:55
@chihao has joined the channel
chihao 17:49:42
哈囉哈囉,建議把討論過程和進度記錄在 https://g0v.hackmd.io/ 這裡喔,這樣更多社群的人更方便讀 🙂

HackMD

HackMD - Collaborative markdown notes

Best way to write and share your knowledge in markdown.

2 1 👌 1
fly 18:00:54
想參加定期聚!麻煩再提供資訊
🌼 1
trello 19:48:21
@trello has joined the channel
simon 22:23:45
我想到這讀句子功能,若能加上文字辨識,做成掃描筆的應用,會更方便,也不用建中英對照句庫了 哈哈
simon 22:40:28
這樣一想,記得手機上的Google translate app好像有你這個讀句子的功能耶...
Awan / 阿旺 22:52:34
我沒用過掃瞄筆,學校的學生和老師可能也和我一樣。讀句子的功能都是 Google 提供的,系出同源~ 沒錯,是一樣的 🌳
英文老師說,liveabc有類似的評分功能,我們可以比看看
Awan / 阿旺 2019-07-23 23:40:23
當初覺得貴就自己寫了… XD
Awan / 阿旺 2019-07-23 23:41:21
想用 google 的力量,把這種語言學習平價化。
Awan / 阿旺 2019-07-28 14:09:59
點讀筆的話,大新書局/地球村也都有。覺得貴、又不能共用,所以都沒買過。
👍 1
Awan / 阿旺 22:54:07
@kindalu set the channel topic: https://g0v.hackmd.io/OAq3-ouBTBScLk7TOYCQtg

2019-07-21

Awan / 阿旺 00:55:39
https://echo-mori.com/ 剛上線了 (⚠️ 只支援 Desktop Chrome & Android Chrome)
預計,明天才會加錯誤訊息 XD
🎉 1
Awan / 阿旺 00:56:56
如果有碰到問題、請上 trello 回報 (點 channel 列的網址 可以前往)
Awan / 阿旺 10:44:12
關於,下次聚會。坑主平常上班到 19:00,所以想約平日晚上8點、或週末早上10點。(週末想避開人,只能約早一點)
時間:8/3 - 8/4 早上10點 (六日), 8/5-8/9 晚上8點 (平日)。
地點:公館捷運站 附近的 漢堡王3F (https://goo.gl/maps/A62PyHzSAj7FRpwE6)
---
8/3點 :six:,8/4點 :seven:。8/5 - 8/9 請點 :one: - :five:。統計到這週五。
時間還不確定 😂
到時會有小聚的會議記錄嗎?
Awan / 阿旺 2019-07-21 18:10:18
我會開一個投影片,請大家把想討論的列上去。可能把決議寫在註解。我看 PM 是這樣做的。
6️⃣ 3 7️⃣ 2 1️⃣ 4 2️⃣ 2 3️⃣ 4 4️⃣ 2 5️⃣ 2
Awan / 阿旺 20:01:48
回音森林口說讀書會
1. 利用這個網站、提升所有成員的英文口說能力
2. 短期目標:準備在下一次大松,提升100個人的口說能力。(一個人十分鐘?)

自己用都不能進步的系統,其他人大概也不會想用吧
以這個為方向,設計網站吧
可能要有一個人假裝老師、還有一群人假裝學生 XD
-
PS: 工程師只能每週貢獻12小時寫程式。很少,功能可以多,但希望網站的設計是簡單、沒有華麗 UI 的。

大家覺得這想法如何?
100人!感覺很挑戰 XDD
Awan / 阿旺 2019-07-22 12:50:03
那目標下調到,30人,分三組。會後持續使用一週。這樣子如何?
Awan / 阿旺 2019-07-27 10:49:42
9 月的大松確定在 9/7 @ 市議會的交誼廳。時程看起來超有難度。
😀 2 1 👍 2
abyss 20:43:01
本身也想提升口說能力
_quote: 自己用都不能進步,其他人大概不會想用_ ))) <點頭如搗蒜>
🌳 1 👍 1

2019-07-22

Awan / 阿旺 09:55:58
感受到大家週末都沒空的氣氛,增加了平日晚上的選項。聚會時間,請大家再投一次票。
👍 2

2019-07-23

2019-07-27

ilovef1001 09:48:56
請問8/5可以嗎?我忘記我那天有事情 所以有投那天 不好意思
Awan / 阿旺 10:05:41
現在8/5(一) & 8/7(四) 都是四個人。有人這兩天,還沒投票想投的嗎?
延長投票時間到今晚12點,如果,都沒有人投的話就 8/5 喔
Awan / 阿旺 10:06:52
仔細看投票細節,大家的時間真的很分散啊…

2019-07-28

Awan / 阿旺 09:59:34
第一回聚會
時間:8/5(一) 20:00
內容:請見 Trello (https://trello.com/b/kbIiQrxJ/回音森林-echo-mori)
地點:公館的漢堡王 3F (https://goo.gl/maps/A62PyHzSAj7FRpwE6)
-
PS: 會寫會議的討論事項 & 總結,給不能來的朋友。

google.com

Google Maps

Find local businesses, view maps and get driving directions in Google Maps.

🆗 1
Awan / 阿旺 13:23:21
明天起,每週一 20:00 ~ 21:00。我都會在公館漢堡王 3F。歡迎來聊天 or Slack 連線參戰。

上三樓後右轉,應該會看到下圖 + 加上坑主一個人。
-
PS:冷氣很強!
Image from iOS
💯 1
Awan / 阿旺 13:29:50
@kindalu set the channel purpose: 外語的口說能力為民生必需品,這個計畫,希望大家都能以很少的代價得到它。
Awan / 阿旺 13:30:30
@kindalu set the channel purpose: 外語的口說能力為民生必需品,回音森林計畫,希望大家都能把它輕易入手。
🍔 3
abyss 14:45:07
大俠都需要的民生必需品

2019-07-29

York 20:30:58
安安 線上參戰在這邊(?
Awan / 阿旺 20:31:47
安安
Awan / 阿旺 20:32:14
目前在報告一週不寫 code
Awan / 阿旺 20:32:36
都在生 user story... 設計
Awan / 阿旺 20:32:53
還有徵翻譯人
Awan / 阿旺 20:34:04
據說有六萬簡中 <-> 英文翻譯。目前希望下週前可以翻200句成繁中,並分成十類。
York 20:44:53
我找人看看0.0
Awan / 阿旺 20:48:46
@ilovef1001 說8/3他們國中同學會,會弄一版50句的,試看看大家想法。
👍 1
Awan / 阿旺 20:49:20
說不定當天,還有英文老師~
Awan / 阿旺 20:50:47
user story 跟有點亂的架構圖第一版 都放在 hackmd 上了
Awan / 阿旺 20:51:21
不過架構圖會重新設計,有遊戲化風和社交風兩個方向。
York 21:03:01
了解,辛苦了
kuruma 21:12:29
@j6gjvm00 has joined the channel
kuruma 21:18:08
大家好
👍 2
Awan / 阿旺 21:23:41
你好~ 剛剛會戰已結束 XD
Awan / 阿旺 21:24:35
晚一點會寫 weekly report。下一次聚會,下週一喔
kuruma 21:25:13
我是軒,目前在一間財經公司擔任PM,剛加進來,還有點搞不清楚狀況。
kuruma 21:25:58
好唷!有看到好像每周一晚上公館漢堡王是大家的約會地點?XD
🌳 1
Awan / 阿旺 21:26:09
主要資訊都在標題的 hackmd
Awan / 阿旺 21:27:06
我們需要 PM,坑主只會寫 Code。大歡迎~
abyss 21:35:09
大歡迎 )))
abyss 21:38:22
@kindalu 如何解決?手機上開啟的狀況
Screenshot_20190729-213641.png
Awan / 阿旺 2019-07-29 21:45:46
我試著轉成 pdf 看看
Awan / 阿旺 2019-07-29 21:47:36
Awan / 阿旺 2019-07-29 21:48:01
PS: 這不是最終版喔。還在修正
I see, thanks
Awan / 阿旺 22:05:43
https://echo-mori.com/ 網頁版也 fix 了。不行再跟我說~

2019-07-30

Casey Huang 07:53:47
@caseysiethy has joined the channel
Casey Huang 07:58:15
大家好~我是高中英文老師
🌼 4 1
Casey Huang 08:00:46
可以幫忙錄音or翻譯的部分
Awan / 阿旺 2019-07-30 08:19:09
老師好,現在還在很早期的實驗階段。這週會需要,大概 1 ~ 200句子,每十句為一組。希望每組都是同類的。
Awan / 阿旺 2019-07-30 08:19:40
目前句子都是自行尋找,像是這個資料庫 https://tatoeba.org/eng/sentences/search?query=&from=eng&to=cmn
Awan / 阿旺 2019-07-30 08:21:25
其實比較想知道的是,google 的語音辨識、語音合成的技術夠不夠幫忙學生學習。
Awan / 阿旺 2019-07-30 08:23:00
Awan / 阿旺 2019-07-30 08:24:21
想請你點上方「回音森林」的連結,然後點連結試看看辨識和合成。如果語音合成夠好的話,就先用 Google 的技術。
Awan / 阿旺 2019-07-30 08:24:43
最後,歡迎你加入 🌳
Stephanie / 鍋鍋 2019-07-30 13:45:01
請問找句子是要找什麼樣的句子?Tatoeba那個好像大多數是單字?
Awan / 阿旺 2019-07-30 13:48:49
tadoeba 都是句子喔。目前只是找分類句子。內部開發測試版用的,像是旅遊、打招呼、聊天氣、問路…
Stephanie / 鍋鍋 2019-07-30 13:49:47
這是我看到的畫面,你那邊有沒有比較理想的範例XD?
https://tatoeba.org/eng/sentences/search?query=&from=eng&to=cmn&page=7
Awan / 阿旺 2019-07-30 13:52:59
加上搜尋就會出現正常點的句子。
Awan / 阿旺 2019-07-30 13:53:23
上班中 先回去潛水…
Awan / 阿旺 2019-07-30 13:55:00
歡迎鍋鍋。
Stephanie / 鍋鍋 2019-07-30 13:55:26
了解了,那我從日常生活用語開始吧。像是這個:
https://davytw.pixnet.net/blog/post/6115305-%E5%B8%B8%E7%94%A8%E8%8B%B1%E6%96%871000%E5%8F%A5
(嗯?好像複製貼上就完成任務了)
Stephanie / 鍋鍋 2019-07-30 13:56:39
啊啊我懂了,要把Tatoeba的數據全部拷過來翻譯成台灣中文對吧
Stephanie / 鍋鍋 2019-07-30 13:56:47
我來開個google sheet
Awan / 阿旺 2019-07-30 13:57:44
先別火力全開啊。有分類兩百句就好。
Awan / 阿旺 2019-07-30 13:58:07
Tadoeba 是 CC License 的所以都能用
Stephanie / 鍋鍋 2019-07-30 13:59:50
今天先把基礎建設架好XD
Stephanie / 鍋鍋 2019-07-30 14:02:23
是不是寫個python把資料全部撈下來再tag比較快?
Awan / 阿旺 2019-07-30 14:03:20
其實網路上有人 還是官方有人做了
Awan / 阿旺 2019-07-30 14:03:55
不過我要先潛水, 解 bug 中。
Stephanie / 鍋鍋 2019-07-30 14:04:08
沒事,我研究一下
Awan / 阿旺 2019-07-30 20:27:47
http://opus.nlpl.eu/Tatoeba.php 這邊有雙語對照分好,找 en-cmn 的下載就對了
Awan / 阿旺 2019-07-30 21:09:57
在 Trello 上開了一張票,assign 給 @yckuo 鍋鍋了。不是要你一個人翻喔,是希望你主導一下。:P
Peiwen 10:43:11
@pw0224 has joined the channel
kNoel 11:08:50
@b00202070 has joined the channel
Stephanie / 鍋鍋 13:37:26
@yckuo has joined the channel
Stephanie / 鍋鍋 13:41:17
大家好我是鍋鍋,現在在矽谷做UX design。可以幫忙英日文翻譯和幫忙做UX相關的research, UI review等等。我很方便的 👍
不過目前只能remote~~~
1 🌆 1
Stephanie / 鍋鍋 13:48:26
對了,因為remote加上時差的關係,希望能給我明確的指示要做什麼事情會比較有效率。請多指教了 <O>
謝謝加入~
Awan / 阿旺 2019-07-30 21:26:38
我卡在這兩個問題,不知道設計師們有沒有什麼想法? (on Trello)
Stephanie / 鍋鍋 2019-07-31 01:08:29
1. 讓貢獻這件事情也遊戲化。比如說每日登入獎勵,可以問他們一個問題,說在這種情境下(可以是很好笑的情境)你會回答什麼?有回答就多積分十分之類的XD
然後放個每日貢獻排行。
之前用滬江網校的時候,每天登入可以換0.1虛擬幣,虛擬幣可以折抵付費課程,我那時候每天都超認真上線XD
2. 就我自己的經驗來說,我覺得社交需求倒是其次。但如果遇到問題的話有人可以協助倒是很好。論壇功能可以放在產品成熟之後,MVP可以先不用有論壇。
Awan / 阿旺 2019-07-31 07:05:07
“虛擬幣可以折抵付費課程” 這點看起來很有用啊。

1. 網站不會收費,但可以考慮加上學習限制,每天只能學100句。但貢獻句子可以增加每日quota之類的。
2. 排行榜好像不錯
3. 社交需求先忘記它,如果有 UX 研究的支持才考慮放回來
第二點 學習者需求 我覺得可以加上程度分類,但如果目前TA都是超級初學者,就不用這個。
Awan / 阿旺 2019-08-04 08:32:11
同意,剛剛在 user story 加了。「訪客,可以根據難度,找到相關句子集」
👌 1 2 👍 1
York 21:53:02
感謝各位朋友被我推坑,阿替目前的功能就是不斷地推坑朋友(誤
Awan / 阿旺 2019-07-30 21:54:21
給我你的 Github 帳號。幫你加入 collaborator 吧 XD
Awan / 阿旺 2019-07-30 21:59:33
邀請了,不知道哪邊會收到通知。
💯 1
chongfong 21:58:32
@wl00796865 has joined the channel
chongfong 22:01:16
大家好~我是被阿替學長推坑的其中一人~~
目前還在瞭解狀況
有日文需求歡迎呼叫我~~😂
Awan / 阿旺 2019-07-30 22:05:44
上面是用 Siri 的服務,網頁版會用 Google 的服務
🌳 1

2019-07-31

Stephanie / 鍋鍋 00:52:16
我把Tatoeba的中英語料庫撈出來了,有124000筆,我正在試著把tag加上去。但我寫的python不太好,資料筆數太多跑不完,等待強者幫忙 😂
Tatoeba 是免費的語庫嗎?
Awan / 阿旺 2019-07-31 06:51:26
CC-BY 和部分 CC0。Tatoeba 語料酷的目的就是提供給其他人開發語言學習軟體。
https://tatoeba.org/cmn/downloads
Awan / 阿旺 2019-07-31 06:52:40
是說矽谷的 UX Designer 都要會寫 Python 嗎?
Stephanie / 鍋鍋 2019-07-31 10:03:01
沒有,只是學校必修 😂
好強喔!
Stephanie / 鍋鍋 00:56:22
晚點來試試用sql
Stephanie / 鍋鍋 00:59:28
我想做成一個欄位是:
id, eng, cmn, tag的表格
這樣就只需要review中文翻譯,以及還沒有中文翻譯的句子,並且可以依照類別分工。
Awan / 阿旺 2019-07-31 07:30:07
剛剛看到 Anki 有整理篩選掉 tatoeba上,可能會有錯誤、和有髒話的部分 XD 想說用這邊的會不會比較好?
http://www.manythings.org/anki/
Awan / 阿旺 2019-07-31 07:32:13
官方有中譯的英文句子有59,000句。Anki 整理完剩21,000句。
Stephanie / 鍋鍋 2019-07-31 09:41:32
不過缺點是沒有tag要自己tag XD
Mars / Kevin Chen 2019-07-31 09:42:56
原本的59000句是有TAG的嗎?如果有的話比對一下就行了?
Mars / Kevin Chen 2019-07-31 09:44:54
(顯示為看不懂59000那邊怎麼下載TAG)
更新:我看懂了😂
Mars / Kevin Chen 2019-07-31 10:02:42
提問✋
@yckuo 提供的那個 Tatoeba 中英語料庫csv,與網站上的一樣嗎?
Stephanie / 鍋鍋 2019-07-31 10:03:59
是的,是從Tatoeba的資料庫裡撈出來,然後只留下中英文
Mars / Kevin Chen 2019-07-31 10:06:16
那我想問的是,這個檔案裡面中文跟英文的對應關係是?還是說如果要找這個檔案裡面任一句子的翻譯,要去另一個地方找?

我剛才翻了一下,好像沒有看到有翻譯的感覺?
Stephanie / 鍋鍋 2019-07-31 10:07:49
Tatoeba的dataset是用ID, one to many(?)
Stephanie / 鍋鍋 2019-07-31 10:08:07
如果是同一句翻譯,中英文是同一個ID。
Stephanie / 鍋鍋 2019-07-31 10:08:28
每個ID也都有一個tag,在另外一個檔案裡
Stephanie / 鍋鍋 2019-07-31 10:09:32
但是anki的檔案裡沒有留下句子的ID,所以有點GG。
Mars / Kevin Chen 2019-07-31 10:13:51
感謝說明 👍 TAG 那邊如果句子完全一樣的話,我可以幫忙上 ID。

但是我在你提供的檔案裡面好像沒看到任兩句有一樣的 id ? 🤔
Stephanie / 鍋鍋 2019-07-31 10:14:19
什麼!!!!(崩潰)
Stephanie / 鍋鍋 2019-07-31 10:15:34
那還是直接用anki的檔案回去對應Tatoeba的句子,再找ID,再用ID對應回tag Orz?
Mars / Kevin Chen 2019-07-31 10:17:35
好像可以,我試試看照你提供的想法 id, eng, cmn, tag 的表格輸出

另外一個 ID 可能應該也是一對多 TAG
Stephanie / 鍋鍋 2019-07-31 10:17:56
應該是~麻煩你了 <O>
Stephanie / 鍋鍋 2019-07-31 10:18:39
或是照tag分成不同檔案也可以,如果檔案誇張大的話
Mars / Kevin Chen 2019-07-31 10:19:22
如果一句有多個 tag 的話,你覺得怎麼呈現比較好呢?我還蠻確定一句有多個 tag 的(像ID = 843583)有至少三個 tag
Stephanie / 鍋鍋 2019-07-31 10:20:10
好問題!
Stephanie / 鍋鍋 2019-07-31 10:23:48
解1: 分成另外一行?如果有三個tag就重複那筆資料三次?
解2: 在不同的tag檔案裡都有相同的句子?
-> 缺點是不同人翻譯的話可能會有不同的翻譯
解3: 每多一個tag就多一列
-> 在用tag分檔案的時候會比較困難
Mars / Kevin Chen 2019-07-31 10:25:53
想要一個句子只有一個 tag,有什麼特別的原因嗎?
Stephanie / 鍋鍋 2019-07-31 10:26:58
我原本是想分工的時候可以用tag來區分,一個人負責一個tag。
不過現在想想應該由句子為單位會比較簡單,等大家翻譯完之後後端再用tag整理。
Stephanie / 鍋鍋 2019-07-31 10:27:23
那就多一列吧~~
Mars / Kevin Chen 2019-07-31 10:35:09
以資料庫的觀點,因為句子跟 tag 是多對多,到時候存的話應該會像目前 tatoeba 一樣,把 ID 跟 tag 的對應分到另一張表?

所以你的考量是翻譯分配時的便利性,對嗎?
Stephanie / 鍋鍋 2019-07-31 10:35:35
是的!
嗯嗯,資料庫這樣設計很合理。
Mars / Kevin Chen 2019-07-31 10:39:45
抱歉我認真工作一下😂
等等回來研究一下怎麼從語料庫撈中英翻譯
Stephanie / 鍋鍋 2019-07-31 10:41:09
感謝你~~~~🎉
Mars / Kevin Chen 2019-07-31 12:30:51
我剛才用程式跑了一下直接載下來的語料庫 ( http://downloads.tatoeba.org/exports/sentences.tar.bz2 ),發現他每一個 ID 都不一樣耶
Stephanie / 鍋鍋 2019-07-31 12:33:20
…………………………
Stephanie / 鍋鍋 2019-07-31 12:33:44
那,我們就直接用anki吧XDDDDD
Mars / Kevin Chen 2019-07-31 12:57:57
像是 anki 表的最後一句的英文是1230633,簡中是1205914
Mars / Kevin Chen 2019-07-31 12:58:09
我覺得我們應該是少看了一個表
Stephanie / 鍋鍋 2019-07-31 12:58:13
挖賽你已經撈出來了好猛
Stephanie / 鍋鍋 2019-07-31 12:58:20
有可能
Mars / Kevin Chen 2019-07-31 12:59:15
不過既然中英都有對應的 ID 了,抓到 TAG 應該不是問題 (吧?)
Stephanie / 鍋鍋 2019-07-31 12:59:56
應該吧,現在我真的搞不懂他資料庫是怎麼設計的了XD
Mars / Kevin Chen 2019-07-31 13:01:27
那我下午來對應一下,話說你那邊應該半夜十二點了?
Awan / 阿旺 2019-07-31 13:03:55
他 Tag 有那些東東啊?
Stephanie / 鍋鍋 2019-07-31 13:09:35
tongue twister, question and answer, time, appreciation, male speaker
Stephanie / 鍋鍋 2019-07-31 13:10:10
咦跟我想像中的像英文課本那樣照旅遊天氣之類的分類有點不太一樣
Stephanie / 鍋鍋 2019-07-31 13:10:30
還是我們就先用Anki開工,然後手工tag?
Awan / 阿旺 2019-07-31 13:17:56
好啊 我下班後再參戰。好像可以加簡繁轉換後的欄位 方便複製
Mars / Kevin Chen 2019-07-31 13:41:16
為了預防有些資料將來可能會用到,我欄位想訂成
```
[英文][簡中][繁中(留白)][手動TAG(留白)][英文ID][簡中ID][英文TAG][中文TAG]
```
然後 tag 的部份以
```
maths,saying,syallabus
```
這樣呈現tag list ,大家覺得如何?
Stephanie / 鍋鍋 2019-07-31 13:44:43
覺得很棒!
我來製作一個可能可以使用的tag範例表,讓大家手動tag的時候比較有方向。大家覺得有哪些建議的tag可以放進來呢?
Mars / Kevin Chen 2019-07-31 13:48:05
我們手動的 Tag 是要照情境,還是要照難度?但是照難度的話分類的人好像要對現行教材有所了解?
Stephanie / 鍋鍋 2019-07-31 13:54:14
感覺也跟未來教材要怎麼分類有關係,我at個高中英文老師 @caseysiethy
Stephanie / 鍋鍋 2019-07-31 13:57:11
嗨~ @caseysiethy 我們在討論句子的tag應該要有哪些建議的選項。要依照情境,或是難度,你有沒有什麼想法?
這也許會和未來的教材有關係。比方說要讓他們選擇情境(像是旅遊、求職、面試、聊天等等),來練習對話。或是依照現有的國高中教材程度來選擇?或是考試類型等等?
Mars / Kevin Chen 2019-07-31 13:58:41
我手先把手頭上的緊急事件處理一下,等一下回來開始整理語料庫 😂
話說 @yckuo 你不去休息嗎,那邊應該很晚了?
Stephanie / 鍋鍋 2019-07-31 13:59:38
我這邊十一點,正在悲慘改作品集中 😢
Casey Huang 2019-07-31 14:40:00
如果TA是國高中學生的話
就要先分成情境之後,再跟著學校教材的文法&單字進度
比如說旅遊再細分成國中一、二、三年級範圍 高中也再細分成一、二、三年級範圍


TA是成人自主學習那種的話
直接依情境分,再由簡單往上排到難的即可
(可適用TOEIC GEPT TOEFL 都行)
Casey Huang 2019-07-31 14:43:12
所以感覺可以tag兩個分類,旅遊還有適用年級?
Stephanie / 鍋鍋 2019-07-31 14:46:13
這樣聽起來,可能可以分成三類:情境、年級、考試類型及其分數區間
Casey Huang 2019-07-31 14:47:25
旅遊、國一、GEPT初級、1000單字
Awan / 阿旺 2019-07-31 14:47:28
PS: 不用現在全部決定,可以等200句測試版上去玩看看。再決定哪些 Tag 好
Awan / 阿旺 2019-07-31 14:48:10
繼續去潛水上班..XD
Casey Huang 2019-07-31 14:48:14
Eg. 面試、高三、GEPT中級、TOEIC、 7000 單
Stephanie / 鍋鍋 2019-07-31 14:49:38
喔喔喔七千單這個好耶~
我想這200句可以先讓大家自行tag情境,難度就先放著讓專業的來tag,或是之後再請老師您開個教學課程,教大家分類年級和考試的難度。
Stephanie / 鍋鍋 2019-07-31 14:50:05
感謝大家上班中不斷多工 😘
Mars / Kevin Chen 2019-07-31 15:43:00
我放到 Google sheet 可以嗎?還是要整理成什麼形式大家比較方便呢?
Mars / Kevin Chen 2019-07-31 18:12:48
簡中的TAG看起來一點都不重要🤣 多數是
`@need native check` `OK` `@wrong transliteration` 等等
Awan / 阿旺 2019-07-31 19:36:01
最後是用 Anki 版的嗎?用 google sheet不錯啊。猜兩萬列應該開的起來
Mars / Kevin Chen 2019-07-31 19:36:36
是Anki版, 我快弄好了,等等release
Awan / 阿旺 2019-07-31 19:39:03
我之前有整理大考七千單 (分六級),托福、GRE。可以把句子標難度⋯ 不過 code 很亂要整。還有一個算英文句子音節數的程式。
Mars / Kevin Chen 2019-07-31 19:40:22
可以要一下code嗎?另外其實 tatoeba 的 tag 有標音節數
Awan / 阿旺 2019-07-31 19:40:51
Swift 猜你不會想看 XD
Awan / 阿旺 2019-07-31 19:41:36
都在 github 上,放的很深。坐捷運中⋯
Awan / 阿旺 2019-07-31 19:41:53
晚一點再分享。
Mars / Kevin Chen 2019-07-31 19:44:07
竟然是 swift 😂
Awan / 阿旺 2019-07-31 20:49:43
之前另個專案跑18萬句,句子難度的結果。因為事前處理用的,code 很亂。也許另外寫。
Awan / 阿旺 2019-07-31 20:52:09
計算音節我是用別人寫的這個 https://github.com/wangchou/SwiftSyllables
Mars / Kevin Chen 2019-07-31 20:52:11
這計算難度的方法蠻有趣的
Awan / 阿旺 2019-07-31 20:53:27
之前 app 裡面句子難度是用 音節數 + 單字難度 * 0.x 去調的。
Awan / 阿旺 2019-07-31 20:55:18
難度應該不會那麼快加… 猜 8/20 左右吧。
Mars / Kevin Chen 2019-07-31 20:56:08
這個難度算法是怎麼想到的呢?
Awan / 阿旺 2019-07-31 20:56:17
還有一件事要提,就是語音辨識結果不能 100%正確。讓 siri 唸給 siri 聽,英文只有 80% 可以唸到 100% 正確。
Awan / 阿旺 2019-07-31 20:56:58
自己當白老鼠測出來的… orz 沒啥根據。不過試過幾種方法,這種好像比較順。
Awan / 阿旺 2019-07-31 20:57:58
我之前是如果兩種語音辨識不能到 100分,就把那句砍掉… haha
Awan / 阿旺 2019-07-31 20:58:23
我之後會再寫技術文 docs。只是先提一下。
Mars / Kevin Chen 2019-07-31 20:58:43
我在想句子的難度應該有一些研究可以參考 ? 或許問問英文老師的意見 ?
Awan / 阿旺 2019-07-31 20:59:23
其實有單字表的話,應該可以限制單字不會超過國一、國二、國三 etc…
Mars / Kevin Chen 2019-07-31 21:33:38
這個是 Tatoeba 的 Anki eng-cmn 語料庫的解析
Awan / 阿旺 2019-07-31 22:24:52
酷斃了 👍👍👍
Awan / 阿旺 2019-07-31 22:29:45
大部分簡中的翻譯可以直接用耶~
要加自己翻譯的欄位嗎?應該還是會有一些台灣/中國用語不同的地方。
Mars / Kevin Chen 2019-07-31 22:30:52
其實我原先是想說這一欄是可以手動輸入的,只是 placeholder 先放簡→繁的機器翻譯
Awan / 阿旺 2019-07-31 22:32:18
了解。那加一小欄可以打勾,確認翻譯是 OK?還是上色就好?
Mars / Kevin Chen 2019-07-31 22:34:29
這個我沒想過 你可以定一下?(我個人覺得打勾比上色好操作);或是讓 UX 設計師想一下如果到時候20K的句子要分配工作的話,怎麼處理會比較有效率?
Stephanie / 鍋鍋 2019-08-01 00:20:21
天哪好猛喔,一個進度突飛猛進。我覺得打勾上色可以。初期應該會分成1-250, 250-500這樣請大家認領。後期維護繼續更新的話我還沒有想法。20k google sheet跑得動嗎XD?
Awan / 阿旺 2019-08-01 01:28:34
我先調成打勾了。然後我發現常常分不出來,用語是不是中國那邊的。
Awan / 阿旺 2019-08-01 01:30:17
還沒 Tag 分類的話,我下週可以弄一版。自動調整難度的, 唸得對就提升難度。唸錯就調降難度。https://docs.google.com/spreadsheets/u/2/d/1sBa-WRJ4K0fNcAK1WKjtChEfUTFElqE2EHJzJCabB_g/edit?usp=sharing 設定像這個。
Awan / 阿旺 2019-08-01 01:32:01
不過設定改成,回音森林有 500公尺。越深入森林,句子越難。唸對才能前進,唸錯就會後退。只要穿越了森林,就能擁有通往另一個國度的語言能力。堅定的中二風 … Orz
Awan / 阿旺 2019-08-01 01:41:05
不過最後還是要拉回來,參考 @caseysiethy 的意見:TA 是學生的話。「情境之後,再跟著學校教材的文法&單字進度」

覺得要把這個討論串的意見,拉到另個文件好好討論。
Mars / Kevin Chen 2019-08-01 10:04:29
如果確定要用這個 Google sheet 的話當工作表格的話,我可以優化一下表格呈現,例如打勾自動上色,及 checkbox
Awan / 阿旺 2019-08-01 10:33:59
我 👌🏼, BTW, Trello 那張票其實有列3個 milestone。但現在進度有些超前,好像要調整一下票。
Mars / Kevin Chen 2019-08-01 11:27:25
已更新,可以看一下現在的工作介面有沒有需要調整的地方
Mars / Kevin Chen 2019-08-01 11:33:01
至於機器自動分類、標難度、上 TAG,我晚一點可以先弄個範例(直接在現有工作表單上加一欄,然後填上去),我們再想辦法改進
Stephanie / 鍋鍋 2019-08-01 13:53:23
天哪真的好猛喔,我覺得現在這個表格很好。那翻譯們就可以開始工作囉?
Stephanie / 鍋鍋 2019-08-01 13:56:07
我有個問題,要修正的話是直接把公式取代掉嗎?原本Google translate的公式是:=GOOGLETRANSLATE(B246,“zh-cn”,“zh-tw”)
Mars / Kevin Chen 2019-08-01 13:56:22
對 取代掉就可以了
但我們的短期目標好像是 200 句的樣子?
Stephanie / 鍋鍋 2019-08-01 13:57:12
嗯嗯,照這個進度應該能比200句多很多,有了中文翻譯之後只需校正也能快很多
Awan / 阿旺 2019-08-01 13:57:29
目標是我花30秒隨便定的。請自由修改。
Mars / Kevin Chen 2019-08-01 13:58:13
我下午來試試看上難度TAG (實驗性)
Mars / Kevin Chen 2019-08-01 15:00:26
剛才研究了一下 `中英Anki 語料庫` 與 `英日Anki語料庫` 的對應關係,感覺不怎麼理想,蠻多一對多的,以下範例供參:

```
Have you eaten dinner? ['夕食はお済みですか。', '晩ご飯は食べましたか。']
Have you eaten your lunch yet? ['お昼ごはんは食べたの?', 'お昼はもう食べた?']
Have you ever been to America? ['アメリカに行ったことはありますか?']
Have you ever climbed Mt. Yari? ['あなたは槍ヶ岳に登ったことがありますか。']
Have you ever dyed your hair? ['髪染めたことある?']
Have you ever eaten Japanese food? ['和食を食べたことはありますか。', '日本の食べ物を食べたことがありますか。', '日本食食べたことある?']
Have you ever had any serious illness? ['今までに重い病気にかかったことがありますか。']
Have you ever had food poisoning? ['食中毒になったことはありますか?', '食中毒の経験はありますか?']
Have you ever seen a UFO? ['空飛ぶ円盤を見た事がありますか。', 'UFO見たことある?']
Have you ever seen such a nice film? ['こんなすばらしい映画を見たことがありますか。']
Have you ever traveled by plane? ['飛行機乗ったことある?']
Have you ever tried scuba diving? ['スキューバダイビングをやったことがありますか。']
Have you finished reading that book? ['その本読み終わったの?']
Have you finished writing the letter yet? ['あなたはもう手紙を書き終えましたか。']
Have you finished your homework? ['宿題は終わったんですか。', '宿題終わった?', '宿題は終わったの?']
```
Mars / Kevin Chen 2019-08-01 15:02:20
然後這句特別有趣,還用了慣用語
```
He came back not because he was homesick, but because he was running short of money.
[
'彼が帰ってきたのは、ホームシックにかかったからではなく、ふところが心細くなったからである。',
'彼が帰ってきたのはホームシックだったからではなく、お金がなくなったからだ。',
'彼が戻ってきたのはホームシックのせいではなくて、財布が軽くなったからだ。'
]
```
Awan / 阿旺 2019-08-02 00:19:11
看起來可能把 Tatoeba 翻譯當輔助。或是初始值,讓網友們可以修改評分會比較好。
Awan / 阿旺 2019-08-02 00:20:28
另外,剛剛被朋友提醒,g0v Slack 因為是免費版的,訊息大概一個月就會被洗掉。這個討論串的內容,週末我會搬到 hackmd 上。
Mars / Kevin Chen 2019-08-02 09:55:44
什麼!我一直以為 G0V 的 Slack 是付費的XD
Awan / 阿旺 2019-08-02 23:43:20
免費版有10000句上限。所以 GOV 一天大概300條訊息。付費版一個人頭要7塊美金 x 幾千人。
Awan / 阿旺 2019-08-02 23:43:35
聽說有人寫 bot 來備份.
jonah 07:18:30
@gccbs02590 has joined the channel
chel_cho 07:22:57
@janet850305 has joined the channel
jonah 07:33:13
大家好 🙂 我是現在剛出社會的菜鳥後端工程師~ 很高興認識大家
Awan / 阿旺 2019-07-31 16:49:20
現在後端空空如也,連資料庫都沒有。只有一些 api 的 wrapper…
Awan / 阿旺 2019-07-31 19:30:55
才正要開工,目前用 nodejs
我晚點回家補自介!這是第一次參加open-source project,希望可以幫上忙。很期待跟各位學習~
🌳 1
chel_cho 07:38:18
大家好~被@tcssh611503 學長推坑~第一次參加開源 實力弱渣只能看看有什麼能幫得上忙的0w0
Awan / 阿旺 2019-07-31 07:50:16
這自介方式很像強者 🤣
對不起拿成大神自介稿了(丟
我真的菜(看著我真誠的眼神
Awan / 阿旺 07:48:26
坑越來越大了~😂 今天晚一點,我會生新手指南 & 自介區。
專案的資料都放在:https://g0v.hackmd.io/OAq3-ouBTBScLk7TOYCQtg
可以先看看,或翻翻這個 channel。

g0v.hackmd.io

:deciduous_tree: 回音森林 (Echo Mori) :deciduous_tree: - HackMD

Awan / 阿旺 22:19:34
<!here> 請大家寫自介。方便推坑 (誤) https://g0v.hackmd.io/xhnoarMjQ72J8kCP8KRNkQ?view

g0v.hackmd.io

回音森林 - 新人指南 &amp; 自介 - HackMD

Awan / 阿旺 2019-07-31 22:22:11
登入後,頁面左上角有編輯按鈕。用 Markdown 格式填寫。
Mars / Kevin Chen 2019-07-31 22:24:41
我一直覺得自我介紹真的是超級困難的東西 😂
Awan / 阿旺 2019-07-31 22:26:09
就寫,我是一隻貓。這樣大家就知道你是強者了 XD