cofacts

Month: 2025-01

2025-01-02

cai 13:43:03
https://data.gov.tw/dataset/165027 這個應該能加到open165,比較多一頁式詐騙的

data.gov.tw

數位發展部數位產業署聲請詐騙網域名稱停止解析網址清單 | 政府資料開放平臺

數位產業署為TWNIC DNS RPZ可信任通報機構,協助電商建立快速打擊詐騙網址,提供民眾查詢減少網路受騙損失。本資料為數位產業署受理電商通報詐騙網址停止解析之網站清單。

好耶我來加進共筆
之後做 worker 爬網頁內容與截圖的時候一併爬取
cai 13:43:03
https://data.gov.tw/dataset/165027 這個應該能加到open165,比較多一頁式詐騙的
好耶我來加進共筆
之後做 worker 爬網頁內容與截圖的時候一併爬取
mrorz 13:50:24
今日議程
https://g0v.hackmd.io/@cofacts/meetings/%2FRWUvX_48TGKgJh7M_BPlKQ

HackMD

Cofacts 會議記錄 - HackMD

# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2025 -

cai 14:03:25
我發現比較新的案例會放在打詐儀表板,可是打詐儀表板沒辦法分享單獨的案例 :no_mouth:
對那部分非常糟 XDDD

之前 @zoee 有跟我聊到這個網址
https://165dashboard.tw/city-case-summary

就是個去識別化到真的遇上了也不知道其實是現存案例的狀況
或許需要重新 index 過
(話說這些案例的授權條款是什麼⋯⋯?還是管他的,先用了再說 XD?)
問問 @mrorz, cofacts 目前用的 infrastructure 是elastic search 嗎?剛剛有下載 weaviate ,但網路太慢裝不了 XD 回家想試試
對,資料庫就是 elasticsearch
連應該要用關聯式資料庫存的東西,也塞進了 elasticsearch,每次開發都要為技術債支付一點利息 lol
假日測試了 weaviate,實在不大靠譜,明明打了 openai 也轉換 embedding 了,吃了我的錢,就是沒存進去 weaviate db,本來想搜尋、api 一次搞定,現在測試起來,結論是直接跳過 weaviate 好了。

改成用 bash 先把 1000 筆內容轉成 openai 相容的 embedding 丟去 github,再處 PoC 試試搜尋,才知道近似內容究竟有無價值。
@jimyhuang 請問這 1000 筆是 165 儀表板的詐騙案例嗎
好奇這種「請樓上小聲、媽媽剛出院」搭訕劇本不知道 165 案例上有沒有
https://www.threads.net/@joker_868h2/post/DEg26i1SBhd?xmt=AQGzZb0sAnvw7M3dSoDLSmuYOe1eXXx2EDa25mZIEbX_Cw
用關鍵字找了一下似乎沒有
畢竟搭訕話術可能太前面了,不是關鍵,不會寫進案例
這樣好好奇挑選案例的準則
之前只有聽說都是真實的(而且每個縣市看起來每天要交的功課也不少 😂)
對耶~~先抓看看
https://github.com/jimyhuang/165cases

先抓完,過兩天算算相似度
好像完成了
• 抓了 15000+ 的 cases
• 將之轉成 OpenAI Embedding,使用 text-embedding-3-large ,全部大概花了1元美金
• 寫了一個 service,全部載入記憶體,可以用 request 打入 query ,算相似度(但每個 query 都得打 openai 去取得 embedding)
https://github.com/jimyhuang/165cases#run-similarity-service
repository 看要移動到哪裡比較方便,License 看怎樣處理好,都可再跟我說~
cai 14:03:25
我發現比較新的案例會放在打詐儀表板,可是打詐儀表板沒辦法分享單獨的案例 :no_mouth:
對那部分非常糟 XDDD

之前 @zoee 有跟我聊到這個網址
https://165dashboard.tw/city-case-summary

就是個去識別化到真的遇上了也不知道其實是現存案例的狀況
或許需要重新 index 過
(話說這些案例的授權條款是什麼⋯⋯?還是管他的,先用了再說 XD?)
問問 @mrorz, cofacts 目前用的 infrastructure 是elastic search 嗎?剛剛有下載 weaviate ,但網路太慢裝不了 XD 回家想試試
對,資料庫就是 elasticsearch
連應該要用關聯式資料庫存的東西,也塞進了 elasticsearch,每次開發都要為技術債支付一點利息 lol
假日測試了 weaviate,實在不大靠譜,明明打了 openai 也轉換 embedding 了,吃了我的錢,就是沒存進去 weaviate db,本來想搜尋、api 一次搞定,現在測試起來,結論是直接跳過 weaviate 好了。

改成用 bash 先把 1000 筆內容轉成 openai 相容的 embedding 丟去 github,再處 PoC 試試搜尋,才知道近似內容究竟有無價值。
@jimyhuang 請問這 1000 筆是 165 儀表板的詐騙案例嗎
好奇這種「請樓上小聲、媽媽剛出院」搭訕劇本不知道 165 案例上有沒有
https://www.threads.net/@joker_868h2/post/DEg26i1SBhd?xmt=AQGzZb0sAnvw7M3dSoDLSmuYOe1eXXx2EDa25mZIEbX_Cw
用關鍵字找了一下似乎沒有
畢竟搭訕話術可能太前面了,不是關鍵,不會寫進案例
這樣好好奇挑選案例的準則
之前只有聽說都是真實的(而且每個縣市看起來每天要交的功課也不少 😂)
對耶~~先抓看看
https://github.com/jimyhuang/165cases

先抓完,過兩天算算相似度
好像完成了
• 抓了 15000+ 的 cases
• 將之轉成 OpenAI Embedding,使用 text-embedding-3-large ,全部大概花了1元美金
• 寫了一個 service,全部載入記憶體,可以用 request 打入 query ,算相似度(但每個 query 都得打 openai 去取得 embedding)
https://github.com/jimyhuang/165cases#run-similarity-service
repository 看要移動到哪裡比較方便,License 看怎樣處理好,都可再跟我說~
💡 2
nonumpa 20:53:15
@jhk482001
```# for apple silicon Mac:
$ docker run -d -p "62223:9200" --name "rumors-test-db" webhippie/elasticsearch:6.4```
@mrorz 原來我寫在 collab-server readme
看要不要也更新到 rumors-api
nonumpa 20:53:15
@jhk482001
```# for apple silicon Mac:
$ docker run -d -p "62223:9200" --name "rumors-test-db" webhippie/elasticsearch:6.4```
@mrorz 原來我寫在 collab-server readme
看要不要也更新到 rumors-api
1 🙌 1
mrorz 22:15:34
原來現在 line messaging api 可以顯示一個 loading indicator

https://developers.line.biz/en/docs/messaging-api/use-loading-indicator/
mrorz 22:15:34
原來現在 line messaging api 可以顯示一個 loading indicator

https://developers.line.biz/en/docs/messaging-api/use-loading-indicator/

developers.line.biz

Display a loading animation

The LINE Developers site is a portal site for developers. It contains documents and tools that will help you use our various developer products. Creating LINE Login and Messaging API applications and services has never been easier!

2025-01-03

mrorz 00:41:59
@jhk482001 關於 test failure,我仔細看了一下
https://github.com/cofacts/rumors-api/actions/runs/12578844144/job/35058128671

他其實是 load fixture 的時候就失敗了,然後 fixture 的格式也確實不正確。
`/users/doc/<id>` 在載入的時候是寫進 `users` index,`users` 裏面確實沒有 `badgeId` 。根據 schema,`badgeId` 應該要在 users 文件下的 `badges` 欄位才對,而且 badges 必須是個陣列。

我在該 branch 推了 3 個 commit:
• Fix lint: 同 README 所述,我們可以用 `npm run lint:fix` 一鍵清除 lint error。另外也手動拿掉了 unused import,有 unused import 的話 lint 不會過。
• 讓 user 的 `badges` 欄位在 GraphQL 是個簡單的 `Badge[]` ,而不是拿到前端到時候會很難用的 `(Badge|undefined)[] | undefined`
• 修好 awardBadge 的 test:
◦ 修正 fixture。順道引入了 schema 裡定義的 type,這樣寫 fixture 的時候只要 typescript type 對,在 Elasticsearch 那裡也就不會插不進去,寫錯了 typechecker 就會告訴我們錯在哪。
image.png
喔喔 感謝 那是我搞錯fixture的用法了, 我今天確認一下 🙏
Castle Cheng 16:58:35
@g25502133 has joined the channel
dogQ 21:48:14
@dog98726345 has joined the channel

2025-01-04

瀧先生 14:55:34
@mister.longgggg has joined the channel
brendan9012 14:57:05
@brendan9012 has joined the channel
jimyhuang 16:17:49
@jimyhuang has joined the channel
ptinn 16:32:29
@ptinn has joined the channel
sun496 17:15:51
@sun496 has joined the channel
ronnywang 22:38:43
@bil @mrorz hihi~ 1/18 的國會松打算要分享如何查找政府預算和立委預算提案,想問問 cofacts 最近有沒有一些預算審查相關的待查核訊息,可以給國會松 1/18 當天的參與者當作查找練習呢
嗯嗯,民眾黨打數發部那個我們今天也有在試著追查看看,不過這樣看起來目前 cofacts 上有在傳的主要就數發部這個跟潛艦國造居多
老人福利法也只有一次回到
https://cofacts.tw/article/2nrgotkkxtsj5
我是覺得廣義上有算(?)就是可能需要用到預算資料去查核的,都是國會松上可以請大家協力去查核的東西~
謝謝大家幫忙提供 cofacts 的寶貴回報,我們近幾日會公布 1/18 國會松的報名資訊,目前正在寫文案中,因為有用到 cofacts 的回報資料,想說會在活動資訊中提一下 cofacts,目前預計的文案如下:
https://docs.google.com/document/d/1kLZIjsRrp08Dq-1K8PjMsdxkPXvUDeUlLCWo3MGIiWU/edit?tab=t.0

請大家幫忙確認這樣的寫法是否 ok 了,謝謝大家
好耶感謝
一月國會松活動上架了!歡迎 cofacts 的大家來玩~這樣之後碰到預算相關的傳言就查核 easy easy:nyan-parrot:
感謝(X)這幾日的預算爭議燒起來,cofacts 上多了一些預算相關的傳言惹
謝謝 cofacts 提供了預算相關的素材,不過因為我們這次國會松有邀到一名國會助理,可以在這次分享很多預算相關的經驗,讓我們重新規劃議程,後來決定忍痛拿掉查核預算謠言的環節,不好意思就沒用到相關素材了
不過如果還是很多人對於查找預算相關感興趣的話,這次國會松也還是會帶到一些資料哪裡找的議題,之後我們也會放出錄影,希望可以幫助之後的查核人員
可以變成下次國會松的主題 XD
我也覺得預算比較緊急一點
國會類謠言查核的其中一難處在查核報告通常都是針對直接有影響的,但謠言提到的往往是間接受牽連的。
ronnywang 22:38:43
@bil @mrorz hihi~ 1/18 的國會松打算要分享如何查找政府預算和立委預算提案,想問問 cofacts 最近有沒有一些預算審查相關的待查核訊息,可以給國會松 1/18 當天的參與者當作查找練習呢
嗯嗯,民眾黨打數發部那個我們今天也有在試著追查看看,不過這樣看起來目前 cofacts 上有在傳的主要就數發部這個跟潛艦國造居多
老人福利法也只有一次回到
https://cofacts.tw/article/2nrgotkkxtsj5
我是覺得廣義上有算(?)就是可能需要用到預算資料去查核的,都是國會松上可以請大家協力去查核的東西~
謝謝大家幫忙提供 cofacts 的寶貴回報,我們近幾日會公布 1/18 國會松的報名資訊,目前正在寫文案中,因為有用到 cofacts 的回報資料,想說會在活動資訊中提一下 cofacts,目前預計的文案如下:
https://docs.google.com/document/d/1kLZIjsRrp08Dq-1K8PjMsdxkPXvUDeUlLCWo3MGIiWU/edit?tab=t.0

請大家幫忙確認這樣的寫法是否 ok 了,謝謝大家
好耶感謝
一月國會松活動上架了!歡迎 cofacts 的大家來玩~這樣之後碰到預算相關的傳言就查核 easy easy:nyan-parrot:
感謝(X)這幾日的預算爭議燒起來,cofacts 上多了一些預算相關的傳言惹
謝謝 cofacts 提供了預算相關的素材,不過因為我們這次國會松有邀到一名國會助理,可以在這次分享很多預算相關的經驗,讓我們重新規劃議程,後來決定忍痛拿掉查核預算謠言的環節,不好意思就沒用到相關素材了
不過如果還是很多人對於查找預算相關感興趣的話,這次國會松也還是會帶到一些資料哪裡找的議題,之後我們也會放出錄影,希望可以幫助之後的查核人員
可以變成下次國會松的主題 XD
我也覺得預算比較緊急一點
國會類謠言查核的其中一難處在查核報告通常都是針對直接有影響的,但謠言提到的往往是間接受牽連的。

2025-01-05

asuka 12:49:28
@aylguo has joined the channel

2025-01-06

mrorz 19:24:56
今日議程 https://g0v.hackmd.io/@cofacts/meetings/%2Fr4Ml_cC4Q8a3_hWQntaVNQ

HackMD

Cofacts 會議記錄 - HackMD

# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2025 -

👍 2

2025-01-07

claire 19:39:31
一月國會松活動上架了!歡迎 cofacts 的大家來玩~這樣之後碰到預算相關的傳言就查核 easy easy:nyan-parrot:

g0vcongressthon.oen.tw

第柒次國會松 - 你真的看得懂立法院預算在審什麼東西嗎?

預算從誕生到通過,需要經歷多少次攻防戰,你知道嗎? 潛艇預算吵得亂糟糟,我們又是如何決定要刪減還是凍結預算呢? 本次 g0v 國會松將帶領大家拆解 #預算審議 的迷霧,了解預算從主計總處產出、再送進立法院到審查通過的過程;也將從教文委員會的角度分享,帶大家一起看懂預算書。 除了了解預算生產流程外,講者將帶著大家查核「Cofacts - 可疑訊息查證平台」上的預算相關傳言,或是新聞上的預算爭議,讓我們一起查找背後的真相吧!

👍 2
mrorz 21:53:09
https://about.fb.com/news/2025/01/meta-more-speech-fewer-mistakes/ Facebook 也要走向 community note 模式了

Meta

More Speech and Fewer Mistakes | Meta

We're ending our third party fact-checking program and moving to a Community Notes model.

看起來是 FB, IG, Threads 一起做
我對 FB 他的 community note 貢獻度公式有興趣,不知道跟 X 的設計是否差不多
X 的貢獻度還滿複雜的
想到一個有趣的題目:

未來對於一個訊息(圖文影音)可能會有四種查證來源
• IFCN certified fact checkers
• X Community Note
• FB / IG / Threads Community Note
• Cofacts (LINE)
以及三組把訊息與查證連結的傳播管道
• X, through community notes
• FB / IG / Threads, through community notes
• LINE, through Cofacts
只要訊息在其中一個平台管道、並在 4 個查證來源之一有結果,那就應該可以用某種形式同步到其他平台上。

目前是人工,但很好奇會不會有機會能用 LLM + 人審核的方式來做
👍 3
mrorz 21:53:09
https://about.fb.com/news/2025/01/meta-more-speech-fewer-mistakes/ Facebook 也要走向 community note 模式了
看起來是 FB, IG, Threads 一起做
我對 FB 他的 community note 貢獻度公式有興趣,不知道跟 X 的設計是否差不多
X 的貢獻度還滿複雜的
想到一個有趣的題目:

未來對於一個訊息(圖文影音)可能會有四種查證來源
• IFCN certified fact checkers
• X Community Note
• FB / IG / Threads Community Note
• Cofacts (LINE)
以及三組把訊息與查證連結的傳播管道
• X, through community notes
• FB / IG / Threads, through community notes
• LINE, through Cofacts
只要訊息在其中一個平台管道、並在 4 個查證來源之一有結果,那就應該可以用某種形式同步到其他平台上。

目前是人工,但很好奇會不會有機會能用 LLM + 人審核的方式來做
mrorz 22:39:22
想到一個有趣的題目:

未來對於一個訊息(圖文影音)可能會有四種查證來源
• IFCN certified fact checkers
• X Community Note
• FB / IG / Threads Community Note
• Cofacts (LINE)
以及三組把訊息與查證連結的傳播管道
• X, through community notes
• FB / IG / Threads, through community notes
• LINE, through Cofacts
只要訊息在其中一個平台管道、並在 4 個查證來源之一有結果,那就應該可以用某種形式同步到其他平台上。

目前是人工,但很好奇會不會有機會能用 LLM + 人審核的方式來做
👍 4 1

2025-01-09

2025-01-10

cai 19:33:23
個人頁面的回報補充你們可以點嗎?我的點了沒反應
那是已知 bug,上(本?)週小聚有發現
啊對齁忘記開票
@mrorz 移除twitter登入好像也沒開
cai 19:33:23
個人頁面的回報補充你們可以點嗎?我的點了沒反應
那是已知 bug,上(本?)週小聚有發現
啊對齁忘記開票
@mrorz 移除twitter登入好像也沒開

2025-01-11

2025-01-13

mrorz 15:22:03
今日議程
https://g0v.hackmd.io/@cofacts/meetings/%2FBhh3mLlNSS-pVQb35KWh0g

HackMD

Cofacts 會議記錄 - HackMD

# Cofacts 會議記錄 - [搜尋](<https://cse.google.com/cse?cx=71f4f7ee215d54fe6>)[target=_blank] ## 2025 -

2025-01-16

2025-01-17

Morgan 05:47:58
@morgan.genz2 has joined the channel

2025-01-18

Pei4 16:03:04
@pei4.cats has joined the channel