新京報訊(記者馮琪)在大語言模型迭代升級新機遇下,3月31日,教育部、國家語委、中央網信辦印發《關于加強數字中文建設 推進語言文字信息化發展的意見》(下稱《意見》),提出到2027年,基本建成國家語言文字大數據中心,初步建成國家關鍵語料庫和國家戰略語言資源信息庫;助力打造中國版人工智能教育大模型等。


《意見》提到,加快建設國家語言文字大數據中心,以數字化技術動態監測、收集和分析語言文字事業發展、國家語言能力建設、重點規劃實施、重大工程進展等核心業務數據,提高數據支持決策效率。同時,實施國家關鍵語料庫共建共享計劃,重點支持建設大規模中文語料庫及高質量民族語言文字語料庫、手語盲文語料庫、行業領域語料庫、語言監測動態語料庫等。


在人才培養方面,《意見》要求,依托國家語言文字關鍵研究領域領航計劃,培養精通語言文字信息化建設的高層次緊缺急需人才。加強語言人才供需機制研究,支持高等學校語言學科與多學科深度交叉融合發展,加強“語言+人工智能”復合型人才培養。


同時,充分發揮地方、高等學校、職業學校、科研機構、行業企業、社會團體等協同作用,共建“數字中文”聯盟,形成語言文字信息技術融合創新、共建共享和轉化應用機制。


《意見》還提到,實施數字中文服務教育發展行動。服務國家教育數字化戰略行動,加強語言文字信息化建設成果在國家智慧教育公共服務平臺和地方智慧教育平臺上推廣共享;助力打造中國版人工智能教育大模型;研究基于大語言模型的教學新范式,研制大語言模型能力素養框架(師生版);提升信息化場景下教師語言文字教學能力;推動全球中文學習平臺、中文聯盟平臺等建設,提升國際中文教育的能力和水平。


在加強有組織科研方面,重點推動生成式人工智能、多模態信息處理、語言理解與生成、跨語言跨模態翻譯等方面的技術創新。加快布局支持一批新型語言文字交叉領域科研機構,重點建設多語言智能化科技創新中心和實驗室。支持數字中文建設、生成式人工智能技術等前沿領域的學術研討和競賽活動。


此外,《意見》支持語言文字信息技術新產品、新職業和新業態發展,鼓勵傳統語言產業數字化轉型升級,培育基于數字中文的新型語言產業。推動語言資源、語言翻譯、智能機器人、中文內容服務等軟硬件產品研發應用,支持圍繞語音、語料、語言應用生態形成產業聚集,鼓勵創建語言產業應用示范品牌。


編輯 繆晨霞

校對 柳寶慶