因為聽到 <@U039CG5S7> 在魔法松講到要找到 Cofacts 上的相似案例,可以用 165dashboard 上面的案例,所以這幾天把案例爬下來,轉換成 openai embedding ,存在這個 repository 上
<https://github.com/jimyhuang/165cases#run-similarity-service|https://github.com/jimyhuang/165cases#run-similarity-service>
• 抓了 15000+ 的詐騙案例
• 將之轉成 OpenAI Embedding,使用 text-embedding-3-large ,15000個案例全部大概花了1元美金
• 寫了一個 service,全部載入記憶體,可以用 request 打入 query ,算相似度(但每個 query 都得打 openai 去取得 embedding vector )
歡迎有 linux 的幫忙測測、給點意見(但是要花 OpenAI token)~~