湖北日報訊(記者韓曉玲、實習生萬蘇雅、通訊員黨波濤)12月12日,國家語委語言資源網(wǎng)上線。該網(wǎng)站由華中師范大學國家語言資源監(jiān)測與研究網(wǎng)絡媒體中心研制,將匯聚優(yōu)質語言資源,最終建設成為我國語言資源領域重要的信息門戶,并為世界了解中國語言生活打開一扇窗口。
國家語言資源監(jiān)測與研究網(wǎng)絡媒體中心自2005年落戶華中師大以來,一直致力建設漢語網(wǎng)絡媒體監(jiān)測語料庫。目前,該語料庫包括網(wǎng)絡新聞、博客、微博、論壇四類語料,各類語料文本已近1.48億篇次,總字符數(shù)達1500億,其中漢字總數(shù)為1300億。這些語料每年以數(shù)百萬篇次的速度增加,為網(wǎng)絡媒體語言現(xiàn)象的研究和監(jiān)測提供了必要的數(shù)據(jù)基礎。而今后,隨著國家語委語言資源網(wǎng)的分期建設,一大批這樣的語料庫將共建共享,為學術研究提供海量資源。
該中心主任、華中師大計算機學院院長何婷婷教授介紹,國家語委語言資源網(wǎng)目前已匯集了國家語委19家科研機構的48種語言資源,以及來自其他高校、研究所、社會機構的開放的各類語言資源,還將不斷補充完善、逐步優(yōu)化。