
感謝來自台語文學作家胡長松、陳金順、洪明道、林瑞崐、王羅蜜多、高嘉徽、小城綾子、陳秀枝與翻譯作家 Manlajo 等人的慷慨授權,目前已累積超過百萬字資料,並全數上架於 Hugging Face
平台,供全球 AI 開發者、學術研究者與文化推廣機構申請使用。
這些語料不僅涵蓋小說、詩歌、論文與翻譯文本,也將陸續補充台灣客語、原住民族語與新住民語等其他語種。團隊亦與語言學界、教育界、數據工程師密切合作,優化語料標註規格與結構,確保資料具備高品質的 AI-ready 特性。Taiwan Tongues 將持續釋出語料並推動相關應用實例,讓本土語言在數位世界中真正被看見。