#newshelper
2019-03-21
bess
23:47:21
@besslee has joined the channel
ronnywang
23:47:55
這邊是我從 2019/3/20 開始爬的五家電視台(中天、民視、三立、TVBS、東森)的資料的整理
ronnywang
23:48:22
主要是針對五家新聞台大標題的部份,針對大標題相同的部份先做了一次性的統合
hcchien
23:48:33
@hcchien407 has joined the channel
ronnywang
23:49:41
不過這樣統合後發現,其實各家電視台並沒有那麼照規則在下標題。以民視為例,我以為他紅色為底的標題是表示某一節新的新聞的開始,藍色底表示這節新聞的後續或訪談內容
ronnywang
23:51:24
但是這樣整理後才發現,民視有的新聞並不會以紅底開始,而是藍底就開始的。以 3/20 11點民視為例 https://ronnywang.github.io/twnews-demo/news.php/formosa/2019032011.csv.html
04:46 開始的「挺賴逼退蔡? 扁駁斥:民主政治 競爭是常態」這一段新聞就不是紅底開始,而是藍底開始
04:46 開始的「挺賴逼退蔡? 扁駁斥:民主政治 競爭是常態」這一段新聞就不是紅底開始,而是藍底開始
2019-03-22
dang
00:12:18
@vulxj0j8j8 has joined the channel
ychsu
01:09:20
@ychsu has joined the channel
lunkai
02:14:05
@kaikaikai1219 has joined the channel
tty791002
02:27:31
@tty791002 has joined the channel
Michael_li
06:25:21
@ronnywang 你用的技術 我看了 HackMD 說明 讓我想起我錄影存檔 八仙塵爆100天12台24小時 的資料處理當時的猜想 用截圖來比對一樣跟不一樣
Michael_li
2019-03-22 06:29:26
那個時候靠媒觀的側錄機器 我買了十幾顆硬碟來備份存檔。
Michael_li
06:29:26
那個時候靠媒觀的側錄機器 我買了十幾顆硬碟來備份存檔。
gugod
08:18:51
@gugod has joined the channel
agameofprivacy
08:22:40
@agameofprivacy has joined the channel
企鵝f
09:11:20
@q1o2o3zxc18 has joined the channel
lilian0330
09:27:50
@lilian0330 has joined the channel
Brook
10:27:37
@mosquitojoe85 has joined the channel
Peace
10:55:43
@achemistd has joined the channel
zoee
11:04:11
@zoee has joined the channel
lucent1090
17:46:41
@shihyen.hwang has joined the channel
Scott
19:31:45
@mmm90415 has joined the channel
hkazami
19:53:43
@mail.hkazami has joined the channel
cwkung2016
20:55:14
@cwkung2016 has joined the channel
uufrienduu
22:53:32
@uufrienduu has joined the channel
2019-03-23
aha
21:05:38
@aha has joined the channel
ShuHuai(Whycat)
21:16:14
@junsuwhy has joined the channel
2019-03-24
ronnywang
00:13:38
我本來想透過新聞大標題來判斷新聞的分段,但是發現很多新聞台的大標題配色根本沒明確規則,可能是看導播心情好 XD
ronnywang
00:14:50
不過我想到一件事,大部份新聞台在講一個新的新聞時,一定是由主播先開始講話,講完後再進入新聞畫面,所以如果我能針對每秒的圖片做人臉辨識,如果能辨識出主播的臉有出現的話,我應該就可以推測這一段是主播正在講一個新的新聞,這樣我就可以區別出不同新聞的時間了
Michael_li
2019-03-28 06:20:17
ronnywang
00:15:22
有人知道有什麼較輕量化的人臉辨識方案嗎?我知道有很多輕量化的人臉偵測
ronnywang
00:20:24
Medium
The npm package for face recognition![]()
ronnywang
22:46:09
https://ronnywang.github.io/set-2019032318/
PS: 以上兩個連結請不要太高調公布喔,畢竟這包含了兩家新聞台一個小時的每秒畫面,可能會有些版權問題…
PS: 以上兩個連結請不要太高調公布喔,畢竟這包含了兩家新聞台一個小時的每秒畫面,可能會有些版權問題…
ronnywang
22:46:44
我拿昨天下午六點的中天和三立做成這樣的頁面,就是一秒一張圖,以方便觀察怎麼用人工判斷新聞已經分段
ronnywang
22:47:02
目前看起來從主播有露臉來判斷是不是分段應該是個不錯的方法
2019-03-27
bk
09:10:22
@nsbh4357 has joined the channel
skygamer
11:06:31
@skygamer has joined the channel
2019-03-28
Anping
00:03:08
@zhaoanping has joined the channel
Michael_li
06:20:17
PCADV 電腦王 - 狂操、硬幹、玩真的
NVIDIA的Jetson是專為AI運算所設計的平台,目前除了有TX1、TX2等主流等級產品外,先前也推出效能更強悍的Jetson AGX Xavier,以滿足運算需求更大的人工智慧應用情境。這...![]()
2019-03-29
hoisee
03:19:09
@hoisee has joined the channel
2019-03-31
ronnywang
15:06:40
ok, 一個新的成果出來了,分段效果我覺得還不錯
ronnywang
15:21:32
接下來有兩個要處理的,一個是我是拿 2019/3/27 12:00 一小時的新聞,跟 2019/3/27 當天上傳到 youtube 的所有新聞做比對,但是看起來有一些沒判斷到的是在 2019/3/26 的新聞,所以也要增加判斷前一兩天的(這個好解決)
ronnywang
15:22:42
但另一個是在電視頻道直播時和在 youtube 上架時標題顏色會不同
ronnywang
15:23:41
因為文字顏色不同所以我這邊就沒比對到了
ronnywang
15:24:24
我可能要研究一下 imagemagick 有沒有辦法可以比對出這種形狀相似但是顏色不同的情況
ronnywang
15:29:05
如果有人熟 imagemagick 的話,可以幫我支援看看上面兩張圖有什麼辦法可以判斷是一樣的嗎?
ronnywang
15:35:47
要用哪一種 metric 演算法比較好,或者先透過什麼處理會比較好
uufrienduu
21:36:13
電視跟直播的都一樣嗎?