thaubing-esg

Month: 2023-07

2023-07-01

阿乾 09:25:56
@xl3fu06 has joined the channel
Isaac 10:26:18
@chthonianc has joined the channel
Ning 11:35:41
@mvpisi3 has joined the channel
dukewen365 13:47:06
@dukewen365 has joined the channel
zoeforworks 14:11:11
@zoeforworks has joined the channel
shoutout 15:56:23
@shoutout has joined the channel
ddio 15:56:47
@shoutout @mvpisi3 今天幫忙做了很詳細的使用者研究!
ddio 15:56:47
@shoutout @mvpisi3 今天幫忙做了很詳細的使用者研究!
shoutout 15:56:48
@shoutout @mvpisi3 今天幫忙做了很詳細的使用者研究! by @ddio 這句話來自這裡 Original message button 翻看成就背包 See the shoutouts button image1
shoutout 15:56:48
@shoutout @mvpisi3 今天幫忙做了很詳細的使用者研究! by @ddio 這句話來自這裡 Original message button 翻看成就背包 See the shoutouts button image1
🧚‍♂️ 2 2
chewei 16:38:55
@chewei has joined the channel
Peter 16:38:56
@sdfghj1001 has joined the channel
pm5 16:39:21
@pm5 has joined the channel
yanyiyi 21:43:54
@yanyiyi has joined the channel

2023-07-02

ronnywang 11:41:30
@ronnywang has joined the channel
ronnywang 11:41:51
https://github.com/euske/pdfminer
昨天有提到可以取出 PDF 所以文字方塊資訊的工具

euske/pdfminer

Python PDF Parser (Not actively maintained). Check out pdfminer.six.

ronnywang 11:41:51
https://github.com/euske/pdfminer
昨天有提到可以取出 PDF 所以文字方塊資訊的工具
ronnywang 11:52:36
其實我覺得用 pdftohtml 就很好用了, pdftohtml -c input.pdf 就可以產生出很接近原始的 PDF 的 HTML ,但裡面的文字都是用 <p style=“positison:absolute;top:xxx;left:xxx” … 的方式絕對定位
ronnywang 11:52:36
其實我覺得用 pdftohtml 就很好用了, pdftohtml -c input.pdf 就可以產生出很接近原始的 PDF 的 HTML ,但裡面的文字都是用 <p style=“positison:absolute;top:xxx;left:xxx” … 的方式絕對定位
👌 1
ddio 22:07:18
豪!我這週想先來做個幫 PDF 搜尋加速的線上網頁!
ddio 22:07:18
豪!我這週想先來做個幫 PDF 搜尋加速的線上網頁!
ddio 22:19:34
大家,我們先暫定了七月接下來的每週五 14:00 ~ 14:30 ,定期線上小聚呦。

想來的人歡迎先來小聚共筆出個聲,有什麼點子,也歡迎寫在共筆上~~

g0v.hackmd.io

2023-07 定期討論 - HackMD

👍 3
ddio 22:19:34
大家,我們先暫定了七月接下來的每週五 14:00 ~ 14:30 ,定期線上小聚呦。

想來的人歡迎先來小聚共筆出個聲,有什麼點子,也歡迎寫在共筆上~~

2023-07-03

Amos 12:42:53
@amosli.tw has joined the channel
Peixing 20:30:20
@paigeliao1989 has joined the channel

2023-07-04

ronnywang 08:35:25
This message contains interactive elements.
1 💡 1 ⚡ 1
ronnywang 08:39:37
螢幕錄影 2023-07-04 上午8.32.40.mov
ddio 10:01:49
PDF 瑞士刀!
ddio 10:01:49
PDF 瑞士刀!
進良Thomas(藥學.要學 坑主) 15:30:47
@thomas502846 has joined the channel
ronnywang 23:35:02
今天新版,已經可以抓出資料了,就只差處理合併儲存格了

增加了框線有壓到的文字會黃色顯示的效果,讓使用者比較好把線放在不壓到字的位置
螢幕錄影 2023-07-04 下午11.33.37.mov
5 1

2023-07-05

YC (Yichun) 13:31:26

證交所做了ESG infohub 網站
在 ESG資料庫 > 永續報告書 有列出各上市公司的永續報告書連結
不知道這樣對資料收集的速度有沒有幫助~

https://esg.twse.com.tw/ESG/front/tw/#/main/home
👍 1
阿乾 18:52:42
HI,大家
週五下午因為遇上四接的環評會,我要去現場,無法參加線上小聚
想問一下有機會挪個時間嗎~
我覺得可以維持,反正每週都有 😛

因為目標是快速同步,有什麼東西,都還是可以丟到 slack 上~
我這週五傾向維持~ 我自己規劃是自行補上文件進度,釋疑與後續我的目標對焦
鶴,我們就維持週五~
👌 再麻煩啦
了解~
那我這邊就再補會議紀錄來跟上~
有遇到什麼問題都可以先放到紀錄中喔
今天四接我不用去現場曬太陽,可以照原本規劃上線喔~
讚喔等等見
@xl3fu06 我先將接下來到 7/19 前平日方便的時段(1.5 hrs~ 2hrs)列下,你可以看看是否有對焦的直接點選就會發行事曆給彼此。若無我們再討論還有哪些其他可能時段~

• 主要會進行觀察培訓、處理資料過程
• 若新閱讀判讀工具有原型,也會一併討論之後能怎麼找出有加速的指標
好神奇的工具!
我這邊可以約下周四(13)下午一點半喔
讚讚有收到囉~那我下週四就直接到你們辦公室,如果有需要提前準備什麼再跟我說
推推 calendly ,約一對一很方便
@xl3fu06 等等 13:30 見囉,再麻煩你了~
阿乾 18:52:42
HI,大家
週五下午因為遇上四接的環評會,我要去現場,無法參加線上小聚
想問一下有機會挪個時間嗎~
我覺得可以維持,反正每週都有 😛

因為目標是快速同步,有什麼東西,都還是可以丟到 slack 上~
我這週五傾向維持~ 我自己規劃是自行補上文件進度,釋疑與後續我的目標對焦
鶴,我們就維持週五~
👌 再麻煩啦
了解~
那我這邊就再補會議紀錄來跟上~
有遇到什麼問題都可以先放到紀錄中喔
今天四接我不用去現場曬太陽,可以照原本規劃上線喔~
讚喔等等見
@xl3fu06 我先將接下來到 7/19 前平日方便的時段(1.5 hrs~ 2hrs)列下,你可以看看是否有對焦的直接點選就會發行事曆給彼此。若無我們再討論還有哪些其他可能時段~

• 主要會進行觀察培訓、處理資料過程
• 若新閱讀判讀工具有原型,也會一併討論之後能怎麼找出有加速的指標
好神奇的工具!
我這邊可以約下周四(13)下午一點半喔
讚讚有收到囉~那我下週四就直接到你們辦公室,如果有需要提前準備什麼再跟我說
推推 calendly ,約一對一很方便
@xl3fu06 等等 13:30 見囉,再麻煩你了~

2023-07-06

ronnywang 08:12:56
https://ronnywang.github.io/pdf-table-cut/html/t100sa11_6505_108.html
完工!

程式碼在 https://github.com/ronnywang/pdf-table-cut/blob/main/input.js
只要在 pdftohtml 產生的 html 最後面加上 <script src=“input.js”></script> 就可以用了,Page49, Page50 的表格都可以試試看
合併儲存格也處理完了
畫完表格後按 Copy 可以複製起來,再去試算表就可以貼上了
ronnywang 08:12:56
https://ronnywang.github.io/pdf-table-cut/html/t100sa11_6505_108.html
完工!

程式碼在 https://github.com/ronnywang/pdf-table-cut/blob/main/input.js
只要在 pdftohtml 產生的 html 最後面加上 <script src=“input.js”></script> 就可以用了,Page49, Page50 的表格都可以試試看
合併儲存格也處理完了
畫完表格後按 Copy 可以複製起來,再去試算表就可以貼上了
ronnywang 08:26:36
https://youtu.be/jt_AfqneBVY
展示在這邊
ddio 10:59:44
強!!! @ronnywang 你要定什麼 license ? 這個可以拿來整 PDF 閱讀器!
BSD License
我想要整 pdf.js ,讓他做成純前端,就不需要 pdftohtml 了
嗯嗯,我也想要把這個放進 pdf.js
不過感覺要做群眾外包的話,用 pdftohtml 產出 html 並找地方上傳還是需要的?如果用 pdf.js 的話好像參與群眾外包的人需要下載 PDF 上傳,會多一個步驟,用 html 他就一頁解決就好?
後面的應用就交給 @ddio 接力用了,我先跳回其他坑了 XD
毫!
怎麼用 pdf.js 抓文字方塊的位置可以參考 https://github.com/ronnywang/pdf-table-extractor/blob/master/pdf-table-extractor.js

主要是「page.getTextContent()」可以得到 content ,然後 「content.items()」可以取得所有文字方塊,x=item.transform[4], y=item.transform[5], str=item.str; 可以得到文字方塊的 x,y和文字內容
ddio 10:59:44
強!!! @ronnywang 你要定什麼 license ? 這個可以拿來整 PDF 閱讀器!
BSD License
我想要整 pdf.js ,讓他做成純前端,就不需要 pdftohtml 了
嗯嗯,我也想要把這個放進 pdf.js
不過感覺要做群眾外包的話,用 pdftohtml 產出 html 並找地方上傳還是需要的?如果用 pdf.js 的話好像參與群眾外包的人需要下載 PDF 上傳,會多一個步驟,用 html 他就一頁解決就好?
後面的應用就交給 @ddio 接力用了,我先跳回其他坑了 XD
毫!
怎麼用 pdf.js 抓文字方塊的位置可以參考 https://github.com/ronnywang/pdf-table-extractor/blob/master/pdf-table-extractor.js

主要是「page.getTextContent()」可以得到 content ,然後 「content.items()」可以取得所有文字方塊,x=item.transform[4], y=item.transform[5], str=item.str; 可以得到文字方塊的 x,y和文字內容
ddio 14:55:06
@xl3fu06 問你個問題,綠盟在分析這些收完的資料時,一定都是只看同產業內的比較嗎?

在想如果之後一手資料不是放在 google 試算表,那要怎麼樣處理資料連動的問題,像是要把資料同步到哪些試算表去。

我知道現在有開始做資料表索引
ddio 14:55:06
@xl3fu06 問你個問題,綠盟在分析這些收完的資料時,一定都是只看同產業內的比較嗎?

在想如果之後一手資料不是放在 google 試算表,那要怎麼樣處理資料連動的問題,像是要把資料同步到哪些試算表去。

我知道現在有開始做資料表索引
阿乾 15:23:37
我們還會看高碳排產業的比較喔
所以也會希望一次看到不同產業別的各家公司的狀況
👍 2 💡 2
阿乾 15:23:37
我們還會看高碳排產業的比較喔
所以也會希望一次看到不同產業別的各家公司的狀況
ddio 20:22:55
豪!隨然看起來是資料中心的守備範圍,但在這邊,也可以一併考慮如何讓資料不只方便存入,也方便讀取的事情。
ddio 20:22:55
豪!隨然看起來是資料中心的守備範圍,但在這邊,也可以一併考慮如何讓資料不只方便存入,也方便讀取的事情。

HackMD

透明足跡PLUS - HackMD

CC-BY 4.0 by 綠色公民行動聯盟 透明足跡網站[target=_blank]

2023-07-07

chiahua 09:44:37
@joyce52057 has joined the channel
ddio 14:50:18
本日快速同步小結:

1. 接下來會以正在進行的 2021 企業報告書,當作驗證標的
2. 做報告書資料建檔時,會順便跑一次使用者研究
3. POC 0.1 進行中,會先做出可以快速搜尋 + 快速瀏覽的 PDF 閱讀器
詳細資訊,請見七月討論共筆

g0v.hackmd.io

2023-07 定期討論 - HackMD

🧚‍♂️ 3 1
ddio 14:50:18
本日快速同步小結:

1. 接下來會以正在進行的 2021 企業報告書,當作驗證標的
2. 做報告書資料建檔時,會順便跑一次使用者研究
3. POC 0.1 進行中,會先做出可以快速搜尋 + 快速瀏覽的 PDF 閱讀器
詳細資訊,請見七月討論共筆

2023-07-10

lading 12:52:10
@lading has joined the channel
lading 12:53:43
Everyone hello. First time to be here.
lading 12:53:43
Everyone hello. First time to be here.

2023-07-13

阿乾 14:53:44
@mvpisi3 這一份給你做測試~
裡面包含了三家公司,台泥、台塑跟中鴻,再麻煩你測試一下填報的流程。
https://docs.google.com/spreadsheets/d/1boBsq4ZmeJnTwCBJRPiNUa-K0DEwTwktywKipgNv_Wk/edit?usp=sharing
收到!我這兩天來走流程,體驗痛苦與天堂~

相關疑問跟回報,明天 weekly meeting 再分享討論
1
阿乾 14:53:44
@mvpisi3 這一份給你做測試~
裡面包含了三家公司,台泥、台塑跟中鴻,再麻煩你測試一下填報的流程。
https://docs.google.com/spreadsheets/d/1boBsq4ZmeJnTwCBJRPiNUa-K0DEwTwktywKipgNv_Wk/edit?usp=sharing
收到!我這兩天來走流程,體驗痛苦與天堂~

相關疑問跟回報,明天 weekly meeting 再分享討論
ddio 20:08:30
窩要先告解,我這週都在做其他打工,沒有進度 👽
1
ddio 20:08:30
窩要先告解,我這週都在做其他打工,沒有進度 👽

2023-07-14

T.C. 13:55:54
@tongchen913 has joined the channel

2023-07-20

chewei 03:31:28
逛到一個服務,以 文件 Doc 來開展互動功能
https://www.konveio.com/
Turn your existing documents into an intuitive, reader-friendly experience that meets your readers’ natural tendency to skim first and dive deeper where interested.
• *Be approachable:* Present documents along with their supplemental resources, including videos and maps, as one connected experience.
• *Simplify complex language:* Automagically add clarity to each page by defining jargon and acronyms.
• *Reduce questions:* Set the stage and present a guided experience to cut down on questions via emails or calls.
• *Single source of truth:* Update versions without sharing new links or attachments; add clarifications and track progress on existing documents.
chewei 03:31:28
逛到一個服務,以 文件 Doc 來開展互動功能
https://www.konveio.com/
介紹影片
Turn your existing documents into an intuitive, reader-friendly experience that meets your readers’ natural tendency to skim first and dive deeper where interested.
• *Be approachable:* Present documents along with their supplemental resources, including videos and maps, as one connected experience.
• *Simplify complex language:* Automagically add clarity to each page by defining jargon and acronyms.
• *Reduce questions:* Set the stage and present a guided experience to cut down on questions via emails or calls.
• *Single source of truth:* Update versions without sharing new links or attachments; add clarifications and track progress on existing documents.
👍 1

2023-07-23

JEN-YU Chang 12:56:42
@sailfish9568 has joined the channel

2023-07-24

ddio 12:14:02
有點小遲到,但總之我下午會出一版!
ddio 12:14:02
有點小遲到,但總之我下午會出一版!
ddio 23:35:10
嘛哈哈哈我好惹!早上再 @ 相關人士~

https://gcaa-org-tw.github.io/company-report-toolkit/

已經可以試玩的:

1. 三本報告書
2. 關鍵字搜尋,包含 19 個內建關鍵字的欄位,也支援自訂關鍵字
a. 若要增修欄位、關鍵字,可以直接到 github 更改,改完之後等 2 分鐘,網站會自己更新,改壞了跟我說 XD
3. 搜尋後,直接跳到對應的頁面
目前使用上還有幾個毛邊,請大家見諒:

1. 縮放相關功能尚未支援,包含報告書預設的大小會不完全滿版
a. 搜尋跳轉的部份,有時候會卡卡,或亂跑,是相關問題,到時後會一併修正
i. 目前碰到的時候,請先滑鼠隨意捲捲,或是點到別的關鍵字,再點回來,就可以修正了
2. ~還沒幫 PDF 有命中的關鍵字上色~ (堪用版 7/25 晚間已上線!)
畫面擷取於 2023-07-24 23.29.40.png

<https://github.com/gcaa-org-tw/company-report-toolkit/blob/main/pdf-viewer-trial/assets/field-map.yml | field-map.yml>

``` - category: 環境 fields: - label: ISO 14064 type: boolean keywords: - 14064 - label: 範疇一直接排放 type: number keywords: - 範疇一 notes: 要抓的是台灣全場的,可能會有各工廠、或是全世界 - label: 範疇二間接排放 type: number keywords: - 範疇二 - 範疇 2 - 範疇2 notes: 要抓的是台灣全場的,可能會有各工廠、或是全世界 - label: 碳密集度 type: string keywords: - 密集度 notes: 可能會分不同場、不同產線,如果有的話,分開寫,須註記單位 - label: 碳定價 type: number keywords: - 碳定價 - label: 總用電量 type: number keywords: - 電力 - 用電 - 能源 notes: 單位:千度,電力只看電力欄位,因為可能會有其他石化燃料等 - label: 再生能源設置量 type: number keywords: - 再生能源 notes: 單位:KW ,可能是寫「沒有使用」 - label: 再生能源發電量 type: number keywords: - 再生能源 notes: 單位:千度,可能是寫「沒有使用」 - category: 社會 fields: - label: 正式員工數 type: number keywords: - 正式員工 - 全職 - 定期員工 notes: 單位:人 - label: 非正式員工數 type: number keywords: - 非正式員工 - 不定期 - 協力 - 派遣 notes: 單位:人 - label: 性別比 type: number keywords: - 性別 notes: 男/女 - label: 是否聘用移工 type: boolean keywords: - 外籍 - 移工 - label: 是否聘用身障人士 type: boolean keywords: - 身心障礙 - label: 新進率 type: number keywords: - 新進 - label: 離職率 type: number keywords: - 離職 - category: 治理 fields: - label: ISO 9001 type: boolean keywords: - 9001 - label: ISO 14001 type: number keywords: - 14001 - label: 營利事業所得稅稅額 type: number keywords: - 繳納 - 營所稅 - 所得 notes: 單位:元 - label: 政府補助、補貼金額 type: number keywords: - 201-4 - 抵減稅額 notes: 單位:元 ```

@mvpisi3 @xl3fu06 可以玩看看了~~
我來開個許願串:

## PDF 版位互動:

觀察到的問題:

1. 要塞下整頁 PDF 的話,文字有高機率太小
2. 搜尋標注要夠醒目,不然 PDF 有點大張
可能的處理方式:

1. 維持使用者設定好的縮放比例
2. 點選搜尋結果實,要能直接看到當頁所有的關鍵字
3. 支援縮放,最好也有熱鍵,像是 ctrl/cmd + 滾輪
4. 方便的移動畫布,像是 space + 滑鼠拖曳
a. 不能直接用拖曳,因為會和選字互動卡到
❤️ 1

2023-07-25

2023-07-28

ddio 13:58:38
今天定期同步共筆
https://g0v.hackmd.io/@ddio-io/open-csr-report/https%3A%2F%2Fg0v.hackmd.io%2FlRmwI5ENTvOfWqH9bPWvZA

HackMD

開放企業永續資料庫 - HackMD

# 開放企業永續資料庫 本文以 CC-BY-4.0 授權釋出 一起來開放企業永續資料庫,用開放資料,促進台灣企業的淨零轉型吧! ## 專案資訊 - [提案共筆](<https://g0v.ha>

ddio 16:15:12
@mvpisi3 @xl3fu06 看看整理好的八月目標,如果有什麼想加的,歡迎隨時加上去~

下個週末我會去 g0v 矽谷灣區小聚講這題,會順便介紹我們想做的事,看有沒有要跳坑

g0v.hackmd.io

2023-07 定期討論 - HackMD

Eventbrite

第0次 g0v 矽谷灣區小聚 :認識 g0v &專案分享|選前大補帖、開放企業永續資料庫、開放政治獻金連署

這是第一場 g0v 零時政府在灣區的社群小聚,除了會介紹 g0v 過去十年來在台灣的發展以外,我們也會在現場與台灣目前正在進行的公民科技專案坑主進行連線交流。歡迎來自各種不同領域、關心台灣公共議題的朋友來參加!

1
ddio 16:15:12
@mvpisi3 @xl3fu06 看看整理好的八月目標,如果有什麼想加的,歡迎隨時加上去~

下個週末我會去 g0v 矽谷灣區小聚講這題,會順便介紹我們想做的事,看有沒有要跳坑

2023-07-31

stella 20:35:18
@stella has joined the channel