【中研院語言所中文自動切音系統】
「中研院語言所中文自動切音系統」整合自動切音(音節、音段)、斷詞與詞類標記功能(詞語、詞類),以製作中文文本與語音對齊之語音研究資料。提供批次處理功能,可減少語音處理人力與時間。自動切音核心功能主要由劉怡芬博士製作;系統功能主要由林業勝統整製作。斷詞與詞類標記功能由陳克健博士團隊提供。
多層次的邊界標記包含
- Word(詞語)、POS(CKIP詞類)、UniversalPOS、
- Syllable(音節)、Pinyin(漢語拼音與調類)、
- Segment(音段)
系統輸入為txt文字檔與wav聲檔;系統輸出為Praat TextGrid格式。
如有疑問或建議,請聯繫曾淑娟研究員(tsengsc@gate.sinica.edu.tw)。