ai-learning

Month: 2024-01

2024-01-06

Ti-Chung 09:54:42
@tcheng10 has joined the channel
jack 09:54:45
@dustar has joined the channel
liaw911114 10:10:15
@liaw911114 has joined the channel
Teemo 22:00:00
• 1.讓通用人工智慧在地化對齊台灣人
https://www.youtube.com/live/qJmb1CmDVAk
https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view
◦ 更多的台灣味、台灣人情味
◦ 多模態中文字的力量與影響力
◦ 在通用人工智慧來臨前,我們可以做的事
◦ 台灣在地 LLM 測試評分的 CC0 資料集創造的未來
◦ 詠唱者啊!加入我們行列吧
Teemo 22:00:00
• 1.讓通用人工智慧在地化對齊台灣人
https://www.youtube.com/live/qJmb1CmDVAk
https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view
◦ 更多的台灣味、台灣人情味
◦ 多模態中文字的力量與影響力
◦ 在通用人工智慧來臨前,我們可以做的事
◦ 台灣在地 LLM 測試評分的 CC0 資料集創造的未來
◦ 詠唱者啊!加入我們行列吧

YouTube

正體中文開源資料集 社群課程:讓通用人工智慧在地化對齊台灣人

#正體中文開源資料集社群課程【讓通用人工智慧在地化對齊台灣人】課程簡報: <https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view1.更多的台灣味、台灣人情味2.多模態中文字的力量與影響力3.在通用人工智慧來臨前,我們可以做的事4.台>...

Canva

01-讓通用人工智慧在地化對齊台灣人

Check out this Presentation designed by Teemo.

❤️‍🔥 3 🙌 4
Teemo 23:19:30
已排程 1/6~1/12 每天晚上10點會自動放送一篇存檔
集數是:
1.讓通用人工智慧在地化對齊台灣人
2.給大語言模型的台灣考卷 TW-Bench
3.大語言模型的民主化
4.開源資料集如何處理隱私與倫理
5.關於測試集-隱私與人權
6.關於內容仲裁
7.測試集的評分標準

--
回歸每周直播的集數
8.拆解全知
9.幻覺
10.暗語、行話以及次文化
11.專業領域-I-台灣集體記憶()
12.專業領域-II-兒時陰影(教育領域)
13.政府的資料-I-流通的
14.人的反饋
15.語感
16.因為你選擇了未來
17.關於20231106那天
18.溫和的部分
19.費米推論
20.大能力模型
21.大知識模型
22.訓練資料的法律問題
Teemo 23:19:30
已排程 1/6~1/12 每天晚上10點會自動放送一篇存檔
集數是:
1.讓通用人工智慧在地化對齊台灣人
2.給大語言模型的台灣考卷 TW-Bench
3.大語言模型的民主化
4.開源資料集如何處理隱私與倫理
5.關於測試集-隱私與人權
6.關於內容仲裁
7.測試集的評分標準

--
回歸每周直播的集數
8.拆解全知
9.幻覺
10.暗語、行話以及次文化
11.專業領域-I-台灣集體記憶()
12.專業領域-II-兒時陰影(教育領域)
13.政府的資料-I-流通的
14.人的反饋
15.語感
16.因為你選擇了未來
17.關於20231106那天
18.溫和的部分
19.費米推論
20.大能力模型
21.大知識模型
22.訓練資料的法律問題
❤️ 1 3

2024-01-07

Teemo 22:00:01
• 2.給大語言模型的台灣考卷 TW-Bench
https://www.youtube.com/live/rPWKwOkCrM0
https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view
◦ 未來有個明確的路徑
◦ 屬於我們的禮貌
◦ 基礎直覺-評分方向
◦ 進階推論-評分方向
◦ 專業運用-評分方向
◦ 如何評估生成結果的好壞
Teemo 22:00:01
• 2.給大語言模型的台灣考卷 TW-Bench
https://www.youtube.com/live/rPWKwOkCrM0
https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view
◦ 未來有個明確的路徑
◦ 屬於我們的禮貌
◦ 基礎直覺-評分方向
◦ 進階推論-評分方向
◦ 專業運用-評分方向
◦ 如何評估生成結果的好壞

YouTube

正體中文開源資料集 社群課程:給大語言模型的台灣考卷 TW-Bench

#正體中文開源資料集社群課程【給大語言模型的台灣考卷 TW-Bench】線上直播時間:2023年12月05日,晚上8:00-8:30課程簡報<https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view1>. 未來有個明確的路徑2. 屬於我們...

Canva

02-給大語言模型的台灣考卷 TW-Bench

Check out this Presentation designed by Teemo.

2024-01-08

Wendy Shih 16:37:12
@wendy7559886 has joined the channel
Teemo 22:00:03
• 3.大語言模型的民主化
https://www.youtube.com/live/Hg7IkVt31qY
https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/view
◦ 深化民主的可能性,再論分層解耦
◦ 對齊我們的民主
◦ 未來是
g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo

YouTube

正體中文開源資料集 社群課程:大語言模型的民主化

#正體中文開源資料集社群課程【大語言模型的民主化】線上直播時間:2023年12月12日,晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/viewg0v> tw hackath56n — 中場短講 — 從 ...

Canva

03-大語言模型的民主化

Check out this Presentation designed by Teemo.

YouTube

g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo

🙌 3
Teemo 22:00:03
• 3.大語言模型的民主化
https://www.youtube.com/live/Hg7IkVt31qY
https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/view
◦ 深化民主的可能性,再論分層解耦
◦ 對齊我們的民主
◦ 未來是
g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo
yunshiuan.chuang 22:45:45
@yunshiuan.chuang has joined the channel

2024-01-09

Teemo 22:00:07
• 4.開源資料集如何處理隱私與倫理
https://www.youtube.com/live/kJvBNjHo81w
https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view
◦ 關於訓練集,雜訊何時是重要
◦ 我們要的雜訊
◦ 模型汙染問題
◦ 差分隱私與合成資料

YouTube

正體中文開源資料集社群課程:開源資料集如何處理隱私與倫理

#正體中文開源資料集社群課程【開源資料集如何處理隱私與倫理】線上直播時間:2023年12月19日,晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view1>. 關於訓練集,雜訊何時是重要2. 我們要的雜...

Canva

04-開源資料集如何處理隱私與倫理

Check out this Presentation designed by Teemo.

Teemo 22:00:07
• 4.開源資料集如何處理隱私與倫理
https://www.youtube.com/live/kJvBNjHo81w
https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view
◦ 關於訓練集,雜訊何時是重要
◦ 我們要的雜訊
◦ 模型汙染問題
◦ 差分隱私與合成資料

2024-01-10

Teemo 22:00:05
• 5.關於測試集-隱私與人權
https://www.youtube.com/live/zcCbJ8ftZzw
https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view
◦ 意圖、故意、「知」與「欲」
◦ 知情同意
◦ 被逆向的原始模型
◦ 協同意見
◦ 兒少保護
Teemo 22:00:05
• 5.關於測試集-隱私與人權
https://www.youtube.com/live/zcCbJ8ftZzw
https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view
◦ 意圖、故意、「知」與「欲」
◦ 知情同意
◦ 被逆向的原始模型
◦ 協同意見
◦ 兒少保護

YouTube

正體中文開源資料集社群課程:關於測試集-隱私與人權

#正體中文開源資料集社群課程【關於測試集-隱私與人權】線上直播時間:2023年12月26日,晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view1>. 意圖、故意、「知」與「欲」2. 知情同意3. 被...

Canva

05-關於測試集-隱私與人權

Check out this Presentation designed by Teemo.

2024-01-11

Teemo 22:00:08
• 6.關於內容仲裁
https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view
https://www.youtube.com/live/lUCWq3lcLqU
◦ 過濾、法律、應備的危險常識
◦ 拒絕違反倫理
◦ 消除歧視與偏見
◦ 警語
◦ 有條件放行

Canva

06-關於內容仲裁

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程:關於內容仲裁

#正體中文開源資料集社群課程【關於內容仲裁】線上直播時間:2024年01月02日,晚上8:00-8:30課程簡報 <https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view1>. 過濾、法律、應備的危險常識2. 拒絕違反倫理3. 消除歧視...

🙌 2 👍 1
Teemo 22:00:08
• 6.關於內容仲裁
https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view
https://www.youtube.com/live/lUCWq3lcLqU
◦ 過濾、法律、應備的危險常識
◦ 拒絕違反倫理
◦ 消除歧視與偏見
◦ 警語
◦ 有條件放行

2024-01-12

kiang 16:21:10


我們MediaTek Research開源了70參數的繁中語言模型 — Breeze-7B 🎉

目前還在測試版,歡迎大家使用和給予回饋。

這個模型有三個亮點:

1. 在中文與英文的成效上,Breeze-7B-Instruct 與同等大小的中文模型相比,表現相當亮眼,甚至可以勝過量級更大的 Taiwan-LM 13B。

2. Breeze-7B 擴充了辭表,加入了3萬個繁中tokens,這同時在速度和字數上得到好處。Breeze-7B在繁中情境下速度比一般基於Mistral或LLaMA的模型快上兩倍,並且最多可以吃上1萬個中文字。

3. 我們也考慮到長文章的使用者,Breeze-7B-Instruct-64k 再延長了8倍最大字數,最多可以吃上8萬個中文字。

而且這些模型都是Apache 2.0授權,請大家放心使用。開源模型連結放在留言區。

模型權重在這:
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v0.1

huggingface.co

MediaTek-Research/Breeze-7B-Instruct-v0.1 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🙌 3 🔥 3
kiang 16:21:10


我們MediaTek Research開源了70參數的繁中語言模型 — Breeze-7B 🎉

目前還在測試版,歡迎大家使用和給予回饋。

這個模型有三個亮點:

1. 在中文與英文的成效上,Breeze-7B-Instruct 與同等大小的中文模型相比,表現相當亮眼,甚至可以勝過量級更大的 Taiwan-LM 13B。

2. Breeze-7B 擴充了辭表,加入了3萬個繁中tokens,這同時在速度和字數上得到好處。Breeze-7B在繁中情境下速度比一般基於Mistral或LLaMA的模型快上兩倍,並且最多可以吃上1萬個中文字。

3. 我們也考慮到長文章的使用者,Breeze-7B-Instruct-64k 再延長了8倍最大字數,最多可以吃上8萬個中文字。

而且這些模型都是Apache 2.0授權,請大家放心使用。開源模型連結放在留言區。

模型權重在這:
https://huggingface.co/MediaTek-Research/Breeze-7B-Instruct-v0.1
Teemo 22:00:05
• 7.測試集的評分標準
https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view
https://www.youtube.com/live/pVXBHxobvB4
◦ 人的部分-閃現與深思
◦ 以平等之名-人權/隱私
◦ 給你大番薯-故意錯字/容忍誤差
◦ 硬幣有正反面,評分也看正反面
◦ 如何設計驗測?

Canva

07-測試集的評分標準

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程:測試集的評分標準

#正體中文開源資料集社群課程【測試集的評分標準】課程簡報: <https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view1>. 人的部分2. 以平等之名3. 給你大番薯4. 硬幣有正反面,評分也看正反面社群課程講師 TeemoTeemo....

Teemo 22:00:05
• 7.測試集的評分標準
https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view
https://www.youtube.com/live/pVXBHxobvB4
◦ 人的部分-閃現與深思
◦ 以平等之名-人權/隱私
◦ 給你大番薯-故意錯字/容忍誤差
◦ 硬幣有正反面,評分也看正反面
◦ 如何設計驗測?

2024-01-13

Teemo 22:00:00
• 8.拆解全知
https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
https://www.youtube.com/live/82VKqXefNBE
◦ 基於知識或是基於推論
◦ Google不到怎麼辦?
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

2024-01-14

Teemo 09:19:29
我自己很喜歡這一集
超時講了很多補充的內容
Teemo 09:19:29
我自己很喜歡這一集
超時講了很多補充的內容
❤️ 2

2024-01-16

chewei 11:36:22
想詢問,還有什麼政府單位文本很適合釋出作為訓練資料?
立法院質詢過程作為 multi-turn conversation 訓練資料
哦哦 延伸想的 縣市議會 似乎也可以挖挖看?
縣市議會也不是每個都有做逐字,而且格式很亂,大概要花很多時間清理才能用

另一個大概就判決書吧,已經釋出但更需要清理
讓 AI 學會尚難非謂無可能
那就超越人類了,之乎者也
🤔 1 1 1 👀 1
chewei 11:36:22
想詢問,還有什麼政府單位文本很適合釋出作為訓練資料?
立法院質詢過程作為 multi-turn conversation 訓練資料
哦哦 延伸想的 縣市議會 似乎也可以挖挖看?
縣市議會也不是每個都有做逐字,而且格式很亂,大概要花很多時間清理才能用

另一個大概就判決書吧,已經釋出但更需要清理
讓 AI 學會尚難非謂無可能
那就超越人類了,之乎者也
David Lee 15:08:07
@davidtaolee has joined the channel

2024-01-17

paulpengtw 16:18:57
https://research.sinica.edu.tw/ali/

研之有物 │ 串聯您與中央研究院的橋梁

當 AI 取代人類執法!改變你對法治價值的認知—專訪陳弘儒 - 研之有物 │ 串聯您與中央研究院的橋梁

人工智慧擔任警察再也不是科幻電影的情節,路上常見的科技執法就是應用 AI 辨識闖紅燈、未依規定轉彎、車輛不停讓行人等違規行為。AI 的客觀、高效率正在挑戰以人為審判主體的法治領域,中央研究院歐美研究所陳弘儒助研究員將帶我們思考:當 AI 取代人類執法時,將如何改變人們對守法的認知?

✏️ 2 🚀 1

2024-01-18

denkenie 10:51:40
@denkenie has joined the channel
silvia 11:02:14
@gitz1594 has joined the channel
Teemo 22:20:21
https://ec.ltn.com.tw/article/breakingnews/4556733

自由時報電子報

AI評測中心啟動 唐鳳:開放廠商送測模型 - 自由財經

〔記者徐子苓/台北報導〕生成式AI席捲全球,但AI帶來的風險和威脅也時常被討論,為了健全可信任AI的環境,數位發展部去年底設立「AI產品與系統評測中心」,唐鳳今天前往視察表示,10個評測項目中有

👍 1 1
LU 23:05:30
@hypothesquerelle has joined the channel

2024-01-21

Sam 20:03:29
@s1101192101 has joined the channel

2024-01-23

Teemo 20:49:01
• 8.拆解全知
https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
https://youtube.com/live/kDr79WnirPg
◦ 基於知識或是基於推論
◦ Google不到怎麼辦?
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

Canva

08-拆解全知

Check out this Presentation designed by Teemo.

YouTube

正體中文開源資料集社群課程:拆解全知

#正體中文開源資料集社群課程【拆解全知】課程簡報: <https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view1>. 基於知識或是基於推論2. 用有限的選擇抑制幻覺3. 數據向善的邏輯4. 自省修正錯誤5. 對齊人的決策選出知識社群課程講...

1 1
Teemo 20:49:01
• 8.拆解全知
https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view
https://youtube.com/live/kDr79WnirPg
◦ 基於知識或是基於推論
◦ Google不到怎麼辦?
◦ 用有限的選擇抑制幻覺
◦ 數據向善的邏輯
◦ 自省修正錯誤
◦ 對齊人的決策選出知識

2024-01-26

kiang 15:03:04
https://huggingface.co/Qwen

感覺回應都還不賴,只要不問台灣這類敏感問題 (?)

huggingface.co

Qwen (Qwen)

Org profile for Qwen on Hugging Face, the AI community building the future.

kiang 15:03:04
https://huggingface.co/Qwen

感覺回應都還不賴,只要不問台灣這類敏感問題 (?)

2024-01-29

eveian.developer 18:26:36
@eveian.developer has joined the channel

2024-01-30

Teemo 10:13:35
以上內容若與徵件細則有所不同,以徵件細則為主。
20240130001.png
20240130003.png
20240130002.png
感謝 Teemo 除錯,徵件時間皆有改變,以徵件細則為主唷!
也提醒大家越早投件越好唷!
👍 1
Teemo 10:13:52
但還是講一下,有個不一致的地方。
Teemo 10:13:52
但還是講一下,有個不一致的地方。