newshelper

Month: 2019-03

2019-03-21

bess 23:47:21
@leechiasan.bess has joined the channel
ronnywang 23:47:55
這邊是我從 2019/3/20 開始爬的五家電視台(中天、民視、三立、TVBS、東森)的資料的整理
ronnywang 23:48:22
主要是針對五家新聞台大標題的部份,針對大標題相同的部份先做了一次性的統合
hcchien 23:48:33
@hcchien407 has joined the channel
ronnywang 23:49:41
不過這樣統合後發現,其實各家電視台並沒有那麼照規則在下標題。以民視為例,我以為他紅色為底的標題是表示某一節新的新聞的開始,藍色底表示這節新聞的後續或訪談內容
ronnywang 23:51:24
但是這樣整理後才發現,民視有的新聞並不會以紅底開始,而是藍底就開始的。以 3/20 11點民視為例 https://ronnywang.github.io/twnews-demo/news.php/formosa/2019032011.csv.html
04:46 開始的「挺賴逼退蔡? 扁駁斥:民主政治 競爭是常態」這一段新聞就不是紅底開始,而是藍底開始

2019-03-22

howjmay 00:12:18
@vulxj0j8j8 has joined the channel
ychsu 01:09:20
@ychsu has joined the channel
lunkai 02:14:05
@kaikaikai1219 has joined the channel
02:27:31
@tty791002 has joined the channel
Michael_li 06:25:21
@ronnywang  你用的技術 我看了 HackMD 說明 讓我想起我錄影存檔 八仙塵爆100天12台24小時 的資料處理當時的猜想 用截圖來比對一樣跟不一樣
Michael_li 06:29:26
那個時候靠媒觀的側錄機器 我買了十幾顆硬碟來備份存檔。
gugod 08:18:51
@gugod has joined the channel
agameofprivacy 08:22:40
@agameofprivacy has joined the channel
企鵝f 09:11:20
@q1o2o3zxc18 has joined the channel
lilian0330 09:27:50
@lilian0330 has joined the channel
Brook 10:27:37
@mosquitojoe85 has joined the channel
Peace 10:55:43
@achemistd has joined the channel
zoee 11:04:11
@zoee has joined the channel
lucent1090 17:46:41
@shihyen.hwang has joined the channel
mmm90415 19:31:45
@mmm90415 has joined the channel
mail.hkazami 19:53:43
@mail.hkazami has joined the channel
cwkung2016 20:55:14
@cwkung2016 has joined the channel
uufrienduu 22:53:32
@uufrienduu has joined the channel

2019-03-23

aha 21:05:38
@aha has joined the channel
書懷 21:16:14
@junsuwhy has joined the channel

2019-03-24

ronnywang 00:13:38
我本來想透過新聞大標題來判斷新聞的分段,但是發現很多新聞台的大標題配色根本沒明確規則,可能是看導播心情好 XD
ronnywang 00:14:50
不過我想到一件事,大部份新聞台在講一個新的新聞時,一定是由主播先開始講話,講完後再進入新聞畫面,所以如果我能針對每秒的圖片做人臉辨識,如果能辨識出主播的臉有出現的話,我應該就可以推測這一段是主播正在講一個新的新聞,這樣我就可以區別出不同新聞的時間了
ronnywang 00:15:22
有人知道有什麼較輕量化的人臉辨識方案嗎?我知道有很多輕量化的人臉偵測
ronnywang 22:46:09
https://ronnywang.github.io/set-2019032318/
PS: 以上兩個連結請不要太高調公布喔,畢竟這包含了兩家新聞台一個小時的每秒畫面,可能會有些版權問題…
ronnywang 22:46:44
我拿昨天下午六點的中天和三立做成這樣的頁面,就是一秒一張圖,以方便觀察怎麼用人工判斷新聞已經分段
ronnywang 22:47:02
目前看起來從主播有露臉來判斷是不是分段應該是個不錯的方法