#ai-learning

Ti-Chung 09:54:42

@tcheng10 has joined the channel

jack 09:54:45

@dustar has joined the channel

liaw911114 10:10:15

@liaw911114 has joined the channel

Teemo 22:00:00

• 1.讓通用人工智慧在地化對齊台灣人
◦ https://www.youtube.com/live/qJmb1CmDVAk
◦ https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view
◦ 更多的台灣味、台灣人情味
◦ 多模態中文字的力量與影響力
◦ 在通用人工智慧來臨前，我們可以做的事
◦ 台灣在地 LLM 測試評分的 CC0 資料集創造的未來
◦ 詠唱者啊！加入我們行列吧

Teemo 22:00:00

• 1.讓通用人工智慧在地化對齊台灣人
◦ https://www.youtube.com/live/qJmb1CmDVAk
◦ https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view
◦ 更多的台灣味、台灣人情味
◦ 多模態中文字的力量與影響力
◦ 在通用人工智慧來臨前，我們可以做的事
◦ 台灣在地 LLM 測試評分的 CC0 資料集創造的未來
◦ 詠唱者啊！加入我們行列吧

YouTube

正體中文開源資料集社群課程：讓通用人工智慧在地化對齊台灣人

#正體中文開源資料集社群課程【讓通用人工智慧在地化對齊台灣人】課程簡報： <https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view1．更多的台灣味、台灣人情味2．多模態中文字的力量與影響力3．在通用人工智慧來臨前，我們可以做的事4．台>...

Canva

01-讓通用人工智慧在地化對齊台灣人

Check out this Presentation designed by Teemo.

❤️‍🔥3
🙌4

Teemo 23:19:30

已排程 1/6~1/12 每天晚上10點會自動放送一篇存檔
集數是：
1.讓通用人工智慧在地化對齊台灣人
2.給大語言模型的台灣考卷 TW-Bench
3.大語言模型的民主化
4.開源資料集如何處理隱私與倫理
5.關於測試集-隱私與人權
6.關於內容仲裁
7.測試集的評分標準

--
回歸每周直播的集數
8.拆解全知
9.幻覺
10.暗語、行話以及次文化
11.專業領域-I-台灣集體記憶()
12.專業領域-II-兒時陰影(教育領域)
13.政府的資料-I-流通的
14.人的反饋
15.語感
16.因為你選擇了未來
17.關於20231106那天
18.溫和的部分
19.費米推論
20.大能力模型
21.大知識模型
22.訓練資料的法律問題

Teemo 23:19:30

已排程 1/6~1/12 每天晚上10點會自動放送一篇存檔
集數是：
1.讓通用人工智慧在地化對齊台灣人
2.給大語言模型的台灣考卷 TW-Bench
3.大語言模型的民主化
4.開源資料集如何處理隱私與倫理
5.關於測試集-隱私與人權
6.關於內容仲裁
7.測試集的評分標準

--
回歸每周直播的集數
8.拆解全知
9.幻覺
10.暗語、行話以及次文化
11.專業領域-I-台灣集體記憶()
12.專業領域-II-兒時陰影(教育領域)
13.政府的資料-I-流通的
14.人的反饋
15.語感
16.因為你選擇了未來
17.關於20231106那天
18.溫和的部分
19.費米推論
20.大能力模型
21.大知識模型
22.訓練資料的法律問題

❤️1
3

Teemo 22:00:01

• 2.給大語言模型的台灣考卷 TW-Bench
◦ https://www.youtube.com/live/rPWKwOkCrM0
◦ https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view
◦ 未來有個明確的路徑
◦ 屬於我們的禮貌
◦ 基礎直覺-評分方向
◦ 進階推論-評分方向
◦ 專業運用-評分方向
◦ 如何評估生成結果的好壞

Teemo 22:00:01

• 2.給大語言模型的台灣考卷 TW-Bench
◦ https://www.youtube.com/live/rPWKwOkCrM0
◦ https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view
◦ 未來有個明確的路徑
◦ 屬於我們的禮貌
◦ 基礎直覺-評分方向
◦ 進階推論-評分方向
◦ 專業運用-評分方向
◦ 如何評估生成結果的好壞

YouTube

正體中文開源資料集社群課程：給大語言模型的台灣考卷 TW-Bench

#正體中文開源資料集社群課程【給大語言模型的台灣考卷 TW-Bench】線上直播時間：2023年12月05日，晚上8:00-8:30課程簡報<https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view1>. 未來有個明確的路徑2. 屬於我們...

Canva

02-給大語言模型的台灣考卷 TW-Bench

Check out this Presentation designed by Teemo.

Wendy Shih 16:37:12

@wendy7559886 has joined the channel

Teemo 22:00:03

• 3.大語言模型的民主化
◦ https://www.youtube.com/live/Hg7IkVt31qY
◦ https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/view
◦ 深化民主的可能性，再論分層解耦
◦ 對齊我們的民主
◦ 未來是
◦ g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo

YouTube

正體中文開源資料集社群課程：大語言模型的民主化

#正體中文開源資料集社群課程【大語言模型的民主化】線上直播時間：2023年12月12日，晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/viewg0v> tw hackath56n — 中場短講 — 從 ...

Canva

03-大語言模型的民主化

Check out this Presentation designed by Teemo.

YouTube

g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo

🙌3

Teemo 22:00:03

• 3.大語言模型的民主化
◦ https://www.youtube.com/live/Hg7IkVt31qY
◦ https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/view
◦ 深化民主的可能性，再論分層解耦
◦ 對齊我們的民主
◦ 未來是
◦ g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo

yunshiuan.chuang 22:45:45

@yunshiuan.chuang has joined the channel

Teemo 22:00:07

• 4.開源資料集如何處理隱私與倫理
◦ https://www.youtube.com/live/kJvBNjHo81w
◦ https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view
◦ 關於訓練集，雜訊何時是重要
◦ 我們要的雜訊
◦ 模型汙染問題
◦ 差分隱私與合成資料

YouTube

正體中文開源資料集社群課程：開源資料集如何處理隱私與倫理

#正體中文開源資料集社群課程【開源資料集如何處理隱私與倫理】線上直播時間：2023年12月19日，晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view1>. 關於訓練集，雜訊何時是重要2. 我們要的雜...

Canva

04-開源資料集如何處理隱私與倫理

Check out this Presentation designed by Teemo.

Teemo 22:00:07

• 4.開源資料集如何處理隱私與倫理
◦ https://www.youtube.com/live/kJvBNjHo81w
◦ https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view
◦ 關於訓練集，雜訊何時是重要
◦ 我們要的雜訊
◦ 模型汙染問題
◦ 差分隱私與合成資料

Teemo 22:00:05

• 5.關於測試集-隱私與人權
◦ https://www.youtube.com/live/zcCbJ8ftZzw
◦ https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view
◦ 意圖、故意、「知」與「欲」
◦ 知情同意
◦ 被逆向的原始模型
◦ 協同意見
◦ 兒少保護

Teemo 22:00:05

• 5.關於測試集-隱私與人權
◦ https://www.youtube.com/live/zcCbJ8ftZzw
◦ https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view
◦ 意圖、故意、「知」與「欲」
◦ 知情同意
◦ 被逆向的原始模型
◦ 協同意見
◦ 兒少保護

YouTube

正體中文開源資料集社群課程：關於測試集-隱私與人權

#正體中文開源資料集社群課程【關於測試集-隱私與人權】線上直播時間：2023年12月26日，晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view1>. 意圖、故意、「知」與「欲」2. 知情同意3. 被...

Canva

05-關於測試集-隱私與人權

Check out this Presentation designed by Teemo.

Teemo 22:00:08

• 6.關於內容仲裁
◦ https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view
◦ https://www.youtube.com/live/lUCWq3lcLqU
◦ 過濾、法律、應備的危險常識
◦ 拒絕違反倫理
◦ 消除歧視與偏見
◦ 警語
◦ 有條件放行

Canva

06-關於內容仲裁

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程：關於內容仲裁

#正體中文開源資料集社群課程【關於內容仲裁】線上直播時間：2024年01月02日，晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view1>. 過濾、法律、應備的危險常識2. 拒絕違反倫理3. 消除歧視...

🙌2
👍1

Teemo 22:00:08

• 6.關於內容仲裁
◦ https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view
◦ https://www.youtube.com/live/lUCWq3lcLqU
◦ 過濾、法律、應備的危險常識
◦ 拒絕違反倫理
◦ 消除歧視與偏見
◦ 警語
◦ 有條件放行

kiang 16:21:10

轉

我們MediaTek Research開源了70參數的繁中語言模型 — Breeze-7B 🎉

目前還在測試版，歡迎大家使用和給予回饋。

這個模型有三個亮點：

1. 在中文與英文的成效上，Breeze-7B-Instruct 與同等大小的中文模型相比，表現相當亮眼，甚至可以勝過量級更大的 Taiwan-LM 13B。

2. Breeze-7B 擴充了辭表，加入了3萬個繁中tokens，這同時在速度和字數上得到好處。Breeze-7B在繁中情境下速度比一般基於Mistral或LLaMA的模型快上兩倍，並且最多可以吃上1萬個中文字。

3. 我們也考慮到長文章的使用者，Breeze-7B-Instruct-64k 再延長了8倍最大字數，最多可以吃上8萬個中文字。

而且這些模型都是Apache 2.0授權，請大家放心使用。開源模型連結放在留言區。

模型權重在這：
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v0.1

huggingface.co

MediaTek-Research/Breeze-7B-Instruct-v0.1 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🙌3
🔥3

kiang 2024-01-12 16:59:07

Breeze-7B-Instruct-64k
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-64k-v0.1/

kiang 16:21:10

轉

我們MediaTek Research開源了70參數的繁中語言模型 — Breeze-7B 🎉

目前還在測試版，歡迎大家使用和給予回饋。

這個模型有三個亮點：

1. 在中文與英文的成效上，Breeze-7B-Instruct 與同等大小的中文模型相比，表現相當亮眼，甚至可以勝過量級更大的 Taiwan-LM 13B。

2. Breeze-7B 擴充了辭表，加入了3萬個繁中tokens，這同時在速度和字數上得到好處。Breeze-7B在繁中情境下速度比一般基於Mistral或LLaMA的模型快上兩倍，並且最多可以吃上1萬個中文字。

3. 我們也考慮到長文章的使用者，Breeze-7B-Instruct-64k 再延長了8倍最大字數，最多可以吃上8萬個中文字。

而且這些模型都是Apache 2.0授權，請大家放心使用。開源模型連結放在留言區。

模型權重在這：
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v0.1

kiang 2024-01-12 16:59:07

Breeze-7B-Instruct-64k
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-64k-v0.1/

kiang 16:59:07

Breeze-7B-Instruct-64k
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-64k-v0.1/

huggingface.co

MediaTek-Research/Breeze-7B-Instruct-64k-v0.1 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Teemo 22:00:05

• 7.測試集的評分標準
◦ https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view
◦ https://www.youtube.com/live/pVXBHxobvB4
◦ 人的部分-閃現與深思
◦ 以平等之名-人權/隱私
◦ 給你大番薯-故意錯字/容忍誤差
◦ 硬幣有正反面，評分也看正反面
◦ 如何設計驗測？

Canva

07-測試集的評分標準

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程：測試集的評分標準

#正體中文開源資料集社群課程【測試集的評分標準】課程簡報： <https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view1>. 人的部分2. 以平等之名3. 給你大番薯4. 硬幣有正反面，評分也看正反面社群課程講師 TeemoTeemo....

Teemo 22:00:05

• 7.測試集的評分標準
◦ https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view
◦ https://www.youtube.com/live/pVXBHxobvB4
◦ 人的部分-閃現與深思
◦ 以平等之名-人權/隱私
◦ 給你大番薯-故意錯字/容忍誤差
◦ 硬幣有正反面，評分也看正反面
◦ 如何設計驗測？

Teemo 22:00:00

• 8.拆解全知
◦ https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
◦ https://www.youtube.com/live/82VKqXefNBE
◦ 基於知識或是基於推論
◦ Google不到怎麼辦？
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

Teemo 09:19:29

我自己很喜歡這一集
超時講了很多補充的內容

Teemo 09:19:29

我自己很喜歡這一集
超時講了很多補充的內容

❤️2

chewei 哲瑋 11:36:22

想詢問，還有什麼政府單位文本很適合釋出作為訓練資料？

🤔1
1
1
👀1

mrorz 2024-01-16 11:40:47

立法院質詢過程作為 multi-turn conversation 訓練資料

chewei 哲瑋 2024-01-16 11:42:02

哦哦延伸想的縣市議會似乎也可以挖挖看？

kiang 2024-01-16 17:27:34

縣市議會也不是每個都有做逐字，而且格式很亂，大概要花很多時間清理才能用

另一個大概就判決書吧，已經釋出但更需要清理

mrorz 2024-01-16 18:46:56

讓 AI 學會尚難非謂無可能

kiang 2024-01-16 18:47:32

那就超越人類了，之乎者也

chewei 哲瑋 11:36:22

想詢問，還有什麼政府單位文本很適合釋出作為訓練資料？

mrorz 2024-01-16 11:40:47

立法院質詢過程作為 multi-turn conversation 訓練資料

chewei 哲瑋 2024-01-16 11:42:02

哦哦延伸想的縣市議會似乎也可以挖挖看？

kiang 2024-01-16 17:27:34

縣市議會也不是每個都有做逐字，而且格式很亂，大概要花很多時間清理才能用

另一個大概就判決書吧，已經釋出但更需要清理

mrorz 2024-01-16 18:46:56

讓 AI 學會尚難非謂無可能

kiang 2024-01-16 18:47:32

那就超越人類了，之乎者也

mrorz 11:40:47

立法院質詢過程作為 multi-turn conversation 訓練資料

chewei 哲瑋 11:42:02

哦哦延伸想的縣市議會似乎也可以挖挖看？

David Lee 15:08:07

@davidtaolee has joined the channel

kiang 17:27:34

縣市議會也不是每個都有做逐字，而且格式很亂，大概要花很多時間清理才能用

另一個大概就判決書吧，已經釋出但更需要清理

mrorz 18:46:56

讓 AI 學會尚難非謂無可能

kiang 18:47:32

那就超越人類了，之乎者也

paulpengtw 16:18:57

https://research.sinica.edu.tw/ali/

paulpengtw 16:18:57

https://research.sinica.edu.tw/ali/

研之有物 │ 串聯您與中央研究院的橋梁

當 AI 取代人類執法！改變你對法治價值的認知—專訪陳弘儒 - 研之有物 │ 串聯您與中央研究院的橋梁

人工智慧擔任警察再也不是科幻電影的情節，路上常見的科技執法就是應用 AI 辨識闖紅燈、未依規定轉彎、車輛不停讓行人等違規行為。AI 的客觀、高效率正在挑戰以人為審判主體的法治領域，中央研究院歐美研究所陳弘儒助研究員將帶我們思考：當 AI 取代人類執法時，將如何改變人們對守法的認知？

✏️2
🚀1

Teemo 23:06:45

baka-invade.org

Teemo 23:06:45

baka-invade.org

denkenie 10:51:40

@denkenie has joined the channel

silvia 11:02:14

@gitz1594 has joined the channel

Teemo 22:20:21

https://ec.ltn.com.tw/article/breakingnews/4556733

自由時報電子報

AI評測中心啟動唐鳳：開放廠商送測模型 - 自由財經

〔記者徐子苓／台北報導〕生成式AI席捲全球，但AI帶來的風險和威脅也時常被討論，為了健全可信任AI的環境，數位發展部去年底設立「AI產品與系統評測中心」，唐鳳今天前往視察表示，10個評測項目中有

👍1
1

Teemo 22:20:21

https://ec.ltn.com.tw/article/breakingnews/4556733

LU 23:05:30

@hypothesquerelle has joined the channel

Sam 20:03:29

@s1101192101 has joined the channel

Teemo 15:47:00

https://youtu.be/3Y3-79NZQZg

YouTube

Taiwan LLM 解析台灣第一個大型對話式語言模型

1

Teemo 15:47:00

https://youtu.be/3Y3-79NZQZg

Teemo 20:49:01

• 8.拆解全知
◦ https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
◦ https://youtube.com/live/kDr79WnirPg
◦ 基於知識或是基於推論
◦ Google不到怎麼辦？
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

Canva

08-拆解全知

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程：拆解全知

#正體中文開源資料集社群課程【拆解全知】課程簡報： <https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view1>. 基於知識或是基於推論2. 用有限的選擇抑制幻覺3. 數據向善的邏輯4. 自省修正錯誤5. 對齊人的決策選出知識社群課程講...

1
1

Teemo 20:49:01

• 8.拆解全知
◦ https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
◦ https://youtube.com/live/kDr79WnirPg
◦ 基於知識或是基於推論
◦ Google不到怎麼辦？
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

kiang 15:03:04

https://huggingface.co/Qwen

感覺回應都還不賴，只要不問台灣這類敏感問題 (?)

huggingface.co

Qwen (Qwen)

Org profile for Qwen on Hugging Face, the AI community building the future.

kiang 15:03:04

https://huggingface.co/Qwen

感覺回應都還不賴，只要不問台灣這類敏感問題 (?)

eveian.developer 18:26:36

@eveian.developer has joined the channel

Teemo 10:13:35

以上內容若與徵件細則有所不同，以徵件細則為主。

👍1

Tiff 2024-01-30 10:58:07

感謝 Teemo 除錯，徵件時間皆有改變，以徵件細則為主唷！
也提醒大家越早投件越好唷！

Teemo 10:13:52

但還是講一下，有個不一致的地方。

Teemo 10:13:52

但還是講一下，有個不一致的地方。

Tiff 10:58:07

感謝 Teemo 除錯，徵件時間皆有改變，以徵件細則為主唷！
也提醒大家越早投件越好唷！

2024-01-06

YouTube

Canva

2024-01-07

YouTube

Canva

2024-01-08

YouTube

Canva

YouTube

2024-01-09

YouTube

Canva

2024-01-10

YouTube

Canva

2024-01-11

Canva

YouTube

2024-01-12

huggingface.co

huggingface.co

Canva

YouTube

2024-01-13

2024-01-14

2024-01-16

2024-01-17

研之有物 │ 串聯您與中央研究院的橋梁

2024-01-18

自由時報電子報

2024-01-21

2024-01-23

YouTube

Canva

YouTube

2024-01-26

huggingface.co

2024-01-29

2024-01-30