
原始标题:在各个方面发布语言数据元素和字符的值。我们“学会每天学习而不观察它,并在没有意识到的情况下使用它。”实际上,语言和写作是重要的教育,科学和技术,文化,经济,安全和战略资源。最近,为了占据升级大型语言模型的新机会,教育部,国家语言委员会和中央网络空间事务办公室发布了“有关加强中国数字建设并促进信息和性格的发展的意见”(之后,它被指定为“意见”)。 3月31日,教育部举行了一次会议大会,以对“意见”提供全面的解释。
信息管理部主任Liu Peijun教育部的语言和性格,介绍了“意见”清楚地表明,数字中国人的构建应被视为实现数字中国建设的重要任务,并且是全面建立语言和性格信息的众所周知的重点,并释放语言的价值,语言的价值以及各个方面的社会发展以及社会和经济特征的各个方面的经济发展。实际上,有必要将中国资源信息转换为智能数据,以一种标准的,有效的批处理方法,同时也可以促进大规模的生产,质量整合,标准管理和重复使用中国数据,以通过数字方式实现新的中国服务系统,并领导并鼓励全面的语言发展和文本开发。
为什么要给数字中文?刘·佩管(Liu Peijun中国增加了民族语言和写作的发展,加深了中国良好的语言和文化的遗产,加强国际交流和学习彼此的语言文明,都需要对中国人的数字授权。中国文化富含内容,是为世界上中国做出贡献的重要公共文化产品。它还需要数字中文数字的分散。中国人被广泛使用,需要更多地研究数字中文。此外,中国数据具有剩余价值。慢性和高质量的中国数据在促进具有汉语特征的大型语言模型的创新发展方面令人愉快,并且需要更多的数字支持穆拉。
Liu Peijun提出,将来,就现代技术和应用而言,我们应该在支持人工智能发展的自然语言处理技术的关键作用中全面发挥作用,加速大型语言模型在现场的试验应用,确保标准和安全,并显示应用程序;开发人工智能的语言资源,管理和应用标准的构建,尤其是数据质量和数据质量评估标准。在数据资源的构建中,我们将全面发挥语言作用和写作在提供民族语言能力,实施国家关键语料库建设计划并制定大型中国语料库方面的战略作用。通过增强主要场所,我们将全面发挥授权国家语言服务系统的构建能力的一般优势,开发了一个框架,以实现大语言模型(教师 - 学生版本)的能力和素养,促进甲骨文骨铭文的数字共享,并实施多语言数字通信计划以实施高效的中国文化课程。
Tang Zhi,董事北北京大学的旺格安计算机研究所指出,在1980年代,激光照明技术的发明使中文在全球互联网空间中重生中国文化。目前,大型语言模型技术指出,对大型高质量语料库的未经启发性要求。在当前的数据和文本元素的发布中,在当前的全面成功中,解决了汉字的投入和输出的重大问题,因此中国信息处理技术的发展丢失了。
唐·齐(Tang Zhi)表示,加强中国数字中国人的建设将提出开发和促进中国信息处理技术的模式,已经进入了一个新阶段。语言和角色将实现从“静态符号”到“动态数字资产”,再到“信息载体”到“劳动因素”的转变。我们应该专注于发展Standa的发展诸如语料库,注释和数据分析之类的RD,并支持各种活动,例如文本生成和理解,语言翻译以及情感分析。语言和文本也可以通过从存储符号到智能建模的更改来实现。因此,有必要专注于Pathe主场,以产生语料库的基础结构并开发支持大型模型培训的高质量中国数据集。
唐·齐(Tang Zhi)强调,语言和写作也将在增强一般发展的能力中发挥作用。在新情况下,语言和文本信息处理技术的创新应用会从“万亿参数大型语言模型”中的“ GB2312字符集”中进行范式变化。语言和文本将与信息技术深入融合,这会产生“技术成功 - 情境繁荣的实施”的良好循环,交付教育发展Pment,帮助进行科学和技术变革,赋予文化遗产,升级行业并促进社会发展。 (《科学与技术日报》,北京,3月31日)
(编辑:杨XI,陈·简)
遵循官方帐户:人 - 金融融资
分享让许多人看到