tw-legal-datasets

Month: 2024-02

2024-02-02

douenergy 02:02:37
@douenergy has joined the channel

2024-02-12

douenergy 15:58:42
我們的提案

https://sch001.g0v.tw/dash/prj/PtS5tIx4HULXi8lS51eCcTT6XVvsmm

sch001.g0v.tw

Francesca

Francesca 的靈感來自於知名影集絕命律師 (Better Call Saul) 中主角 Jimmy 的女助手 Francesca。 她是 Jimmy 律師事務所的第一個助手,在面試的過程中,Jimmy 問了 Francesca 在她前一份監理站的工作中,是否曾經對來換發駕照的老人不耐煩過? Francesca 回答中展現的耐心,成功為她贏來了這份工作。 LLM 的巨大潛力,是過去兩年最讓人興奮的 AI 應用,但一如圖靈獎得主 Alan Kay 的名言 “ People who are really serious about software should make their own hardware ” , 我們相信要發揮 LLM 最大的潛力需要高品質的資料集 “ People who are really serious about LLM should curate their own dataset ”。 收集資料集是複雜且需要耐心的工作,期待我們如 Francesca 一樣決不對資料不耐煩 :blush:

lafin 15:58:42
@lafin has joined the channel
novatseng 16:04:30
@nova1219 has joined the channel
isabelhou 16:30:58
@isabelhou has joined the channel
kuan 17:39:57
@kuan180 has joined the channel
gim/dpupperr 20:52:10
@rgm79ms has joined the channel

2024-02-13

paulpengtw 15:57:06
@paulpengtw has joined the channel
irvin 18:07:51
@irvin has joined the channel
Renee Pena 18:39:52
@fimoci1758 has joined the channel
jack 19:58:34
@dustar has joined the channel
RS 20:55:39
@rschiang has joined the channel

2024-02-14

Charlie 20:26:27
@aaronhsieh1997 has joined the channel
luyunqiao2008.2.16 21:55:13
@luyunqiao2008.2.16 has joined the channel

2024-02-15

dikamo3557 06:31:35
@dikamo3557 has joined the channel

2024-02-16

Eli 06:33:45
@tomy7912348 has joined the channel

2024-02-17

進良Thomas(藥學.要學 坑主) 17:59:38
@thomas502846 has joined the channel

2024-02-19

douenergy 13:46:40
Francesca 第一步會聚焦在刑事的資料集上
更具體說是專注在的以下刑法判決書

1.毒品(刑事)
2.賭博罪(刑)
3.竊盜罪(刑)
4.傷害罪(刑)
5.過失致死(刑)
6.妨害名譽(刑)
7.詐欺罪(刑)

大家如果覺得有什麼 可以加入的重要刑事判決類型 ? 歡迎提出來討論

我們會很開心告訴你 為什麼我們會專注這些刑事案件跟為什麼先省略某些類型的刑事案件 😆

或是我們認為民事案件的資料困難點在哪裡?
douenergy 13:46:40
Francesca 第一步會聚焦在刑事的資料集上
更具體說是專注在的以下刑法判決書

1.毒品(刑)
2.賭博罪(刑)
3.竊盜罪(刑)
4.傷害罪(刑)
5.過失致死(刑)
6.妨害名譽(刑)
7.詐欺罪(刑)

大家如果覺得有什麼 可以加入的重要刑事判決類型 ? 歡迎提出來討論

我們會很開心告訴你 為什麼我們會專注這些刑事案件跟為什麼先省略某些類型的刑事案件 😆

或是我們認為收集民事案件的資料困難點在哪裡?
Eli 15:24:42
好奇你們是用判決全文還是司法院編碼過的終結案件資料庫?
Eli 15:24:42
好奇你們是用判決全文還是司法院編碼過的終結案件資料庫?
Eli 15:26:54
我在幫一個老師做量化的實證法學研究案,所以有處理司法院的終結案件資料庫,資料編碼設計超複雜XD
Eli 15:26:54
我在幫一個老師做量化的實證法學研究案,所以有處理司法院的終結案件資料庫,資料編碼設計超複雜XD
Eli 15:48:53
我們方法上只用到傳統的統計,所以是把刑事終結案件的資料庫做成一個能跑統計的資料框,跟LLM需要的資料結構可能很遠,不確定對你們來說有沒有用https://github.com/tomy7912348/Taiwan_judical_case_data
Eli 15:48:53
我們方法上只用到傳統的統計,所以是把刑事終結案件的資料庫做成一個能跑統計的資料框,跟LLM需要的資料結構可能很遠,不確定對你們來說有沒有用https://github.com/tomy7912348/Taiwan_judical_case_data

tomy7912348/Taiwan_judical_case_data

司法院判決資料庫整理

2024-02-20

douenergy 20:37:54
@tomy7912348 Hi
我們第一次知道有 終結案件資料庫 🙏

目前我們只專注在判決全文 因為我們認為要轉換判決中的 主文 表格..等成為結構化的資料就很有實務上的價值
https://opendata.judicial.gov.tw/dataset?keyword=終結案件&sort.publishedDate.order=desc&page=1 資料編的變項蠻多的,應該可以省掉很多從判決主文撈的麻煩
非常有用的資訊

我們會來看一下 判決主文跟結案資料各有什麼優缺點 👍
douenergy 20:37:54
@tomy7912348 Hi
我們第一次知道有 終結案件資料庫 🙏

目前我們只專注在判決全文 因為我們認為要轉換判決中的 主文 表格..等成為結構化的資料就很有實務上的價值
https://opendata.judicial.gov.tw/dataset?keyword=終結案件&sort.publishedDate.order=desc&page=1 資料編的變項蠻多的,應該可以省掉很多從判決主文撈的麻煩
非常有用的資訊

我們會來看一下 判決主文跟結案資料各有什麼優缺點 👍

2024-02-28

Teemo 10:52:41
@teemocogs has joined the channel