ai-learning

Month: 2023-07

2023-07-01

宋小海 11:42:43
@littlesea922 has joined the channel

2023-07-02

ronnywang 10:46:54
我有 idea 來做將即時串流影片即時透過 whisper 產生即時逐字稿,我來實作看看
3
ronnywang 10:46:54
我有 idea 來做將即時串流影片即時透過 whisper 產生即時逐字稿,我來實作看看
ronnywang 11:32:36
```streamlink 'https://www.youtube.com/watch?v=oIgbl7t0S_w' 240p -O | ffmpeg -i /dev/stdin -vn -acodec pcm_s16le -ar 16000 -ac 2 -f segment -segment_time 5 -reset_timestamps 1 -strftime 1 output_%s.wav```
上面的指令可以即時把一隻 youtube live 影片,輸出成純聲音 wav 檔,並且 5 秒就切一個檔,檔名會用 output_xxx.wav 的格式,xxx 會是 unix timestamp
ronnywang 11:32:36
```streamlink 'https://www.youtube.com/watch?v=oIgbl7t0S_w' 240p -O | ffmpeg -i /dev/stdin -vn -acodec pcm_s16le -ar 16000 -ac 2 -f segment -segment_time 5 -reset_timestamps 1 -strftime 1 output_%s.wav```
上面的指令可以即時把一隻 youtube live 影片,輸出成純聲音 wav 檔,並且 5 秒就切一個檔,檔名會用 output_xxx.wav 的格式,xxx 會是 unix timestamp
👍 5

2023-07-03

ronnywang 22:25:35
https://www.youtube.com/watch?v=Y44RzmIvmFU
效果還不錯,不過在我的 Macbook Air 大概會延遲 60 秒左右
ronnywang 22:25:35
https://www.youtube.com/watch?v=Y44RzmIvmFU
效果還不錯,不過在我的 Macbook Air 大概會延遲 60 秒左右

YouTube

測試用 whisper 即時轉逐字稿

❤️ 1 1
ronnywang 22:37:51
https://gist.github.com/ronnywang/07f597003678982a4a158f07ea6d7533
程式碼放在這裡

原理如下:
1. 先用 ffmpeg + streamlink 即時以最低畫質下載 youtube 實況影片,並且以 5 秒為單位存一個 wav 檔
2. 把除了最新的一個 wav 檔以外的即時合併在一起(因為最新的正在寫入中,會無法讀取)
3. 對這個 wav 做 whisper ,根據檔名的 timestamp 加上時間軸可以知道話是幾點鐘講的
4. whisper 最後一句話有可能被切到一半,因此不要輸出最後一句,記下最後一句話的時間,再用之前 whisper 處理的最後一個 wav 檔跟他後面新的 wav 合併在一起,重覆動作 2
ronnywang 22:37:51
https://gist.github.com/ronnywang/07f597003678982a4a158f07ea6d7533
程式碼放在這裡

原理如下:
1. 先用 ffmpeg + streamlink 即時以最低畫質下載 youtube 實況影片,並且以 5 秒為單位存一個 wav 檔
2. 把除了最新的一個 wav 檔以外的即時合併在一起(因為最新的正在寫入中,會無法讀取)
3. 對這個 wav 做 whisper ,根據檔名的 timestamp 加上時間軸可以知道話是幾點鐘講的
4. whisper 最後一句話有可能被切到一半,因此不要輸出最後一句,記下最後一句話的時間,再用之前 whisper 處理的最後一個 wav 檔跟他後面新的 wav 合併在一起,重覆動作 2
kiang 23:28:27
如果可以常駐會好一點,這樣看起來會一直卡在模型的載入時間
kiang 23:28:27
如果可以常駐會好一點,這樣看起來會一直卡在模型的載入時間
ronnywang 23:29:34
yes,我用 whisper.cpp 好像不太能省下載入 model 的時間,不確定用 openai 原廠的 whisper 能不能省這時間
ronnywang 23:29:34
yes,我用 whisper.cpp 好像不太能省下載入 model 的時間,不確定用 openai 原廠的 whisper 能不能省這時間
kiang 23:48:39
把這個裝起來就可以透過指令呼叫,在 webui 的部分模型是常駐的,透過 API 去呼叫就可以運用常駐的模型解析語音,但不確定效果如何
kiang 23:48:39
把這個裝起來就可以透過指令呼叫,在 webui 的部分模型是常駐的,透過 API 去呼叫就可以運用常駐的模型解析語音,但不確定效果如何

2023-07-04

kiang 00:04:23
另一個號稱可以處理台語的新模型,應該要找機會玩玩

https://github.com/facebookresearch/fairseq/tree/main/examples/mms
kiang 00:04:23
另一個號稱可以處理台語的新模型,應該要找機會玩玩

https://github.com/facebookresearch/fairseq/tree/main/examples/mms
Bogdan 17:12:55
@boron-aide0c has joined the channel

2023-07-05

bil 18:37:37
@bil has joined the channel
Flynn Devine 19:41:05
@flynndevine has joined the channel
huger 20:07:29
@hsiehwp has joined the channel

2023-07-06

linekin 08:50:42
@linekin has joined the channel
kiang 11:02:13
如果有興趣針對路口交通影像進行 AI 研究可以申請這份資料
https://www.iot.gov.tw/cp-29-210022-ac35a-1.html
🚥 3 👀 3
kiang 11:02:13
如果有興趣針對路口交通影像進行 AI 研究可以申請這份資料
https://www.iot.gov.tw/cp-29-210022-ac35a-1.html

2023-07-07

cchsieh60 22:56:04
@cchsieh60 has joined the channel

2023-07-10

2023-07-11

a-chioh 02:13:05
@a-chioh has joined the channel

2023-07-12

paulpengtw 00:43:25
#徵書 #支援前線 #g0v圖書館
想問是否有已經讀完的「21世紀機器人新律」,想借書一週,會疼會養會愛護(?)
願意以一杯咖啡相許,作為借書費用~
你要英文版嗎?我有全文
paulpengtw 2023-07-12 23:31:16
好耶!感謝 peter QQ
paulpengtw 00:43:25
#徵書 #支援前線 #g0v圖書館
想問是否有已經讀完的「21世紀機器人新律」,想借書一週,會疼會養會愛護(?)
願意以一杯咖啡相許,作為借書費用~
你要英文版嗎?我有全文
paulpengtw 2023-07-12 23:31:16
好耶!感謝 peter QQ

2023-07-13

Michelle H 04:11:10
@itsmichellehsu has joined the channel

2023-07-14

Peter 00:35:56
周二的讀書會有提到工會目前對於技術的衝擊似乎尚未有完整應對,不過剛剛重看好萊塢編劇工會的罷工訴求,感覺是有的
Peter 00:35:56
周二的讀書會有提到工會目前對於技術的衝擊似乎尚未有完整應對,不過剛剛重看好萊塢編劇工會的罷工訴求,感覺是有的
Peter 00:36:00
https://plainlaw.me/posts/Writers-Guild-of-America-Strike

法律白話文運動

「慘!美劇斷炊!」從美國編劇工會罷工,談 AI 科技背後的利益風暴|娛樂運動

睽違 15 年,美國編劇工會(Writers Guild of America,WGA)以 97.85% 的壓倒性票數,宣布從 2023 年 5 月 2 日開始,代表超過 1 萬 1 千名成員發動罷工。直到談判結束前,不繼續為影視作品提供編劇服務。身處台灣的我們,也不免被影響,許多大作像是:《怪奇物語》、《最後生還者》、《刀鋒戰士》、《玩命關頭 11》,製作期可能因此延宕,無法如期播出。如果我們深入了解美國編劇工會罷工的原因,會發現一場「科技改變影視娛樂產業」的風暴正席捲而來。從圖像、影音的生成,到音樂、聲音創作整個產業鏈都被鯨吞蠶食,而現在連「文字劇本開發」的工作,也漸漸被暴風圈籠罩。

T.C. 13:44:03
@tongchen913 has joined the channel

2023-07-17

yiwen850514 17:27:27
@yiwen850514 has joined the channel

2023-07-19

2023-07-20

kiang 07:29:38
這兩天遇到 , faster-whisper-webui 在處理特定音檔的時候跑了兩天還跑不完, 2 個小時長度,不是很確定是掛服務掛太久還是有特定原因,嘗試重新啟動就好一點了(重開治百病?
kiang 07:29:38
這兩天遇到 , faster-whisper-webui 在處理特定音檔的時候跑了兩天還跑不完, 2 個小時長度,不是很確定是掛服務掛太久還是有特定原因,嘗試重新啟動就好一點了(重開治百病?

2023-07-23

chewei 23:03:15
行政院及所屬機關(構)使用生成式AI參考指引(草案)徵集意見中
https://join.gov.tw/policies/detail/9f21a1e6-edd0-45e9-8ad6-b92354abb1fa
本參考指引(草案)共計十點如下:

一、為使行政院及所屬機關(構)(以下簡稱各機關)使用生成式AI提升行政效率,並避免其可能帶來之國家安全、資訊安全、人權、隱私、倫理及法律等風險,特就各機關使用生成式AI應注意之事項,訂定本參考指引。

二、生成式AI產出之資訊,仍需業務承辦人就其風險進行客觀且專業的最終判斷,不得取代業務承辦人自主思維、創造力及人際互動。

三、製作機密文書應由業務承辦人親自撰寫,禁止使用生成式AI。 前項所稱機密文書,指行政院「文書處理手冊」所定之國家機密文書及一般公務機密文書。

四、業務承辧人不得向生成式AI提供涉及公務應保密、個人及未經機關(構)同意公開之資料,亦不得向生成式AI詢問可能涉及機密業務之問題,或運用生成式AI蒐集或處理個人資料。

五、各機關不可完全信任生成式AI產出之資訊,亦不得以未經確認之產出內容直接作成行政行為或作為公務決策之唯一依據。

六、各機關使用生成式AI作為執行業務或提供服務輔助工具時,應適當揭露。

七、使用生成式AI應遵守資通安全、個人資料保護、著作權與相關資訊使用規定,並注意其侵害智慧財產權與人格權之可能性。各機關得依使用生成式AI之設備及業務性質,訂定使用生成式AI之規範或內控管理措施。

八、各機關應就所辦採購事項,要求得標之法人、團體或個人注意本參考指引,並遵守各該機關依前點所訂定之規範或內控管理措施。

九、公營事業機構、公立學校、行政法人及政府捐助之財團法人使用生成式AI,得準用本參考指引。

十、行政院及所屬機關(構)以外之其他機關得參照本參考指引,另訂各該機關使用生成式AI之規範。
逛到一個服務,也是針對政府文件導入對話機器人,幫使用者讀文件文書全文、幫使用者找內容段落
https://www.konveio.com/ai
7/28 錄製的 demo 影片 https://youtu.be/aowGD6I7ow8
預算書、環評書、都市計畫書..?
🤔 3
chewei 23:03:15
行政院及所屬機關(構)使用生成式AI參考指引(草案)徵集意見中
https://join.gov.tw/policies/detail/9f21a1e6-edd0-45e9-8ad6-b92354abb1fa
本參考指引(草案)共計十點如下:

一、為使行政院及所屬機關(構)(以下簡稱各機關)使用生成式AI提升行政效率,並避免其可能帶來之國家安全、資訊安全、人權、隱私、倫理及法律等風險,特就各機關使用生成式AI應注意之事項,訂定本參考指引。

二、生成式AI產出之資訊,仍需業務承辦人就其風險進行客觀且專業的最終判斷,不得取代業務承辦人自主思維、創造力及人際互動。

三、製作機密文書應由業務承辦人親自撰寫,禁止使用生成式AI。 前項所稱機密文書,指行政院「文書處理手冊」所定之國家機密文書及一般公務機密文書。

四、業務承辧人不得向生成式AI提供涉及公務應保密、個人及未經機關(構)同意公開之資料,亦不得向生成式AI詢問可能涉及機密業務之問題,或運用生成式AI蒐集或處理個人資料。

五、各機關不可完全信任生成式AI產出之資訊,亦不得以未經確認之產出內容直接作成行政行為或作為公務決策之唯一依據。

六、各機關使用生成式AI作為執行業務或提供服務輔助工具時,應適當揭露。

七、使用生成式AI應遵守資通安全、個人資料保護、著作權與相關資訊使用規定,並注意其侵害智慧財產權與人格權之可能性。各機關得依使用生成式AI之設備及業務性質,訂定使用生成式AI之規範或內控管理措施。

八、各機關應就所辦採購事項,要求得標之法人、團體或個人注意本參考指引,並遵守各該機關依前點所訂定之規範或內控管理措施。

九、公營事業機構、公立學校、行政法人及政府捐助之財團法人使用生成式AI,得準用本參考指引。

十、行政院及所屬機關(構)以外之其他機關得參照本參考指引,另訂各該機關使用生成式AI之規範。
逛到一個服務,也是針對政府文件導入對話機器人,幫使用者讀文件文書全文、幫使用者找內容段落
https://www.konveio.com/ai
7/28 錄製的 demo 影片 https://youtu.be/aowGD6I7ow8
預算書、環評書、都市計畫書..?

2023-07-24

chewei 12:27:22
活動訊息轉貼:生成式人工智慧 (GenAI) 導入設計思考工作坊研究。研究目的為透過設計思考工作坊中團隊之間與AI的互動過程與產出的結果,探討GenAI對設計師個體聯想力歷程的影響。
chewei 12:27:22
活動訊息轉貼:生成式人工智慧 (GenAI) 導入設計思考工作坊研究。研究目的為透過設計思考工作坊中團隊之間與AI的互動過程與產出的結果,探討GenAI對設計師個體聯想力歷程的影響。
Peter 15:17:55
活動訊息轉貼:*AI X 數位人權 亞洲契機交流會 Intersection:Exchange Activities for AI x Digital Rights*

ocftw.kktix.cc

交叉觀點:AI X 數位人權 亞洲契機交流會 Intersection:Exchange Activities for AI x Digital Rights

以 AI 產業作為主題,透過跨界對話,一同在亞太脈絡之下,暢談在商業之中納入數位人權的重要性和可能途徑。本次特邀數發部長 -唐鳳蒞臨,並由 LINE、Access Now 等各界領袖共襄盛舉。

2023-07-25

Ze Hung 10:31:28
@zehung860486 has joined the channel
lora10101007 12:46:18
@lora10101007 has joined the channel

2023-07-26

allen880714 11:31:58
@allen880714 has joined the channel

2023-07-27

Dong 10:08:57
@ay870527 has joined the channel

2023-07-29

Joyce Huang 17:17:01
@joycehuang28 has joined the channel

2023-07-30

ff03279 12:19:22
@ff03279 has joined the channel

2023-07-31

Yanun Yang 18:01:00
@yanun0323 has joined the channel