(Dataset of Formosan-Mandarin sentence pairs)
點我進入互動式查詢系統
- 以下資料經由網路爬蟲取得。
- 詞典資料使用
PDFMiner
將2019版的PDF檔轉成HTML,再用BeautifulSoup
抓取句對,偶爾會出現族語跟華語對不上的情形。若發現錯誤,請聯絡我📩。詞典中重複出現的句子已從資料集中刪除。- 📚 詞典: 原住民族語言線上詞典
- 💻 點擊下面的預覽圖即可進入統計報告互動式查看頁面。報告中新增
word_counts
欄位,計算族語句子的字數。