newshelper

Month: 2019-03

2019-03-21

bess 23:47:21
@leechiasan.bess has joined the channel
ronnywang 23:47:55
這邊是我從 2019/3/20 開始爬的五家電視台(中天、民視、三立、TVBS、東森)的資料的整理
ronnywang 23:48:22
主要是針對五家新聞台大標題的部份,針對大標題相同的部份先做了一次性的統合
hcchien 23:48:33
@hcchien407 has joined the channel
ronnywang 23:49:41
不過這樣統合後發現,其實各家電視台並沒有那麼照規則在下標題。以民視為例,我以為他紅色為底的標題是表示某一節新的新聞的開始,藍色底表示這節新聞的後續或訪談內容
ronnywang 23:51:24
但是這樣整理後才發現,民視有的新聞並不會以紅底開始,而是藍底就開始的。以 3/20 11點民視為例 https://ronnywang.github.io/twnews-demo/news.php/formosa/2019032011.csv.html
04:46 開始的「挺賴逼退蔡? 扁駁斥:民主政治 競爭是常態」這一段新聞就不是紅底開始,而是藍底開始

2019-03-22

howjmay 00:12:18
@vulxj0j8j8 has joined the channel
ychsu 01:09:20
@ychsu has joined the channel
lunkai 02:14:05
@kaikaikai1219 has joined the channel
02:27:31
@tty791002 has joined the channel
Michael_li 06:25:21
@ronnywang  你用的技術 我看了 HackMD 說明 讓我想起我錄影存檔 八仙塵爆100天12台24小時 的資料處理當時的猜想 用截圖來比對一樣跟不一樣
Michael_li 06:29:26
那個時候靠媒觀的側錄機器 我買了十幾顆硬碟來備份存檔。
gugod 08:18:51
@gugod has joined the channel
agameofprivacy 08:22:40
@agameofprivacy has joined the channel
企鵝f 09:11:20
@q1o2o3zxc18 has joined the channel
lilian0330 09:27:50
@lilian0330 has joined the channel
Brook 10:27:37
@mosquitojoe85 has joined the channel
Peace 10:55:43
@achemistd has joined the channel
zoee 11:04:11
@zoee has joined the channel
lucent1090 17:46:41
@shihyen.hwang has joined the channel
Scott 19:31:45
@mmm90415 has joined the channel
mail.hkazami 19:53:43
@mail.hkazami has joined the channel
cwkung2016 20:55:14
@cwkung2016 has joined the channel
uufrienduu 22:53:32
@uufrienduu has joined the channel

2019-03-23

aha 21:05:38
@aha has joined the channel
書懷 21:16:14
@junsuwhy has joined the channel

2019-03-24

ronnywang 00:13:38
我本來想透過新聞大標題來判斷新聞的分段,但是發現很多新聞台的大標題配色根本沒明確規則,可能是看導播心情好 XD
ronnywang 00:14:50
不過我想到一件事,大部份新聞台在講一個新的新聞時,一定是由主播先開始講話,講完後再進入新聞畫面,所以如果我能針對每秒的圖片做人臉辨識,如果能辨識出主播的臉有出現的話,我應該就可以推測這一段是主播正在講一個新的新聞,這樣我就可以區別出不同新聞的時間了
ronnywang 00:15:22
有人知道有什麼較輕量化的人臉辨識方案嗎?我知道有很多輕量化的人臉偵測
ronnywang 22:46:09
https://ronnywang.github.io/set-2019032318/
PS: 以上兩個連結請不要太高調公布喔,畢竟這包含了兩家新聞台一個小時的每秒畫面,可能會有些版權問題…
ronnywang 22:46:44
我拿昨天下午六點的中天和三立做成這樣的頁面,就是一秒一張圖,以方便觀察怎麼用人工判斷新聞已經分段
ronnywang 22:47:02
目前看起來從主播有露臉來判斷是不是分段應該是個不錯的方法

2019-03-27

nsbh 09:10:22
@nsbh4357 has joined the channel
skygamer 11:06:31
@skygamer has joined the channel

2019-03-28

Anping 00:03:08
@zhaoanping has joined the channel
ronnywang 21:26:02
先針對 youtube 上中天的頻道先整理一下他單隻新聞影片

2019-03-29

hoisee 03:19:09
@hoisee has joined the channel

2019-03-31

ronnywang 15:06:40
ok, 一個新的成果出來了,分段效果我覺得還不錯
ronnywang 15:21:32
接下來有兩個要處理的,一個是我是拿 2019/3/27 12:00 一小時的新聞,跟 2019/3/27 當天上傳到 youtube 的所有新聞做比對,但是看起來有一些沒判斷到的是在 2019/3/26 的新聞,所以也要增加判斷前一兩天的(這個好解決)
ronnywang 15:22:42
但另一個是在電視頻道直播時和在 youtube 上架時標題顏色會不同
ronnywang 15:22:54
Youtube 上
Pasted image at 2019-03-31, 3:22 PM
ronnywang 15:23:14
電視直播上
Pasted image at 2019-03-31, 3:23 PM
ronnywang 15:23:41
因為文字顏色不同所以我這邊就沒比對到了
ronnywang 15:24:24
我可能要研究一下 imagemagick 有沒有辦法可以比對出這種形狀相似但是顏色不同的情況
ronnywang 15:27:32
Pasted image at 2019-03-31, 3:27 PM
ronnywang 15:27:43
Pasted image at 2019-03-31, 3:27 PM
ronnywang 15:29:05
如果有人熟 imagemagick 的話,可以幫我支援看看上面兩張圖有什麼辦法可以判斷是一樣的嗎?
ronnywang 15:35:47
要用哪一種 metric 演算法比較好,或者先透過什麼處理會比較好
uufrienduu 21:36:13
電視跟直播的都一樣嗎?