
5月23日,人工智能高质量语料库建设共建单位启动会议在深圳举办。首批来自出版、传媒、版权保护、数字技术等领域的22家共建单位代表齐聚现场,发布《人工智能高质量语料库建设倡议书》,推动我国人工智能高质量语料库建设的标准化、合规化和协同化。
当前,我国人工智能产业进入规模化落地、规范化发展的关键阶段,大模型对高质量、正版化、可确权、可商用的权威知识语料需求持续攀升。但是,模型训练行业长期面临语料来源杂乱、内容质量参差不齐、版权授权壁垒突出、侵权风险高发等难题制约着人工智能产业健康长远发展。为破解行业发展瓶颈、补齐可信合规语料短板,中国大百科全书出版社牵头发起人工智能高质量语料库共建工作,汇聚出版行业、媒体行业、科技企业、版权保护等领域的力量,构建良性产业生态。
会上,中国大百科全书出版社社长高世屹详细介绍语料库共建的时代背景、核心目的与行业价值,并宣读了22家首批共建单位名单。他表示,共建工作以整合优质行业资源、打通版权授权堵点、构建互利共赢产业生态为核心目标,始终坚守“先授权、后使用”原则,聚力打造可确权、可商用的权威正版语料库。
会议现场正式发布《人工智能高质量语料库建设倡议书》,向全行业及社会各界发出五点倡议:坚持版权为先,筑牢合法合规底线;坚持质量为本,共建权威可信语料体系;坚持标准引领,规范全流程管理;坚持协同共治,强化行业自律和联合维权;坚持开放共享,健全授权机制。
交流研讨环节,人民出版社、人民文学出版社、学习出版社、“学习强国”学习平台、中国新闻出版传媒集团、中华书局、中信出版集团、中国地图出版社集团、视觉(中国)文化发展股份有限公司等多家单位代表,围绕语料库行业标准制定、版权授权模式创新、数字技术支撑赋能、行业自律共治等议题深入交流。大家一致表示,将坚守版权底线与质量红线,携手整治行业乱象,共商合规大计、共建语料体系、共护正版资源、共筑产业生态。
人工智能高质量语料库建设首批22家共建单位分别为:中国大百科全书出版社、人民出版社、人民文学出版社、学习出版社、“学习强国”学习平台、中国新闻出版传媒集团、中华书局、生活·读书·新知三联书店、中国民主法制出版社、中信出版集团、中国地图出版社集团、中国中医药出版社、广东人民出版社、海峡书局、广东版权保护联合会、黑龙江省版权保护协会、北京中版链科技有限公司、视觉(中国)文化发展股份有限公司、金东数字创意股份有限公司、南宁峰值文化传播有限公司、华视网聚(常州)文化传媒有限公司、博拉网络股份有限公司。共建单位表示,将坚守守正创新初心,恪守版权为先、质量为本原则,全力将人工智能高质量语料库打造为经得起法律检验、技术检验和时代检验的标杆工程。
此次共建汇聚出版央企、主流媒体、版权机构、数字科技企业等全产业链主体,构建起覆盖内容生产、版权运营、标准制定、技术支撑的完整协同链条。未来,共建各方还将依托区块链等前沿技术,实现语料授权、流转、交易全链路可追溯,持续开展行业标准研发、年度论坛举办、行业报告发布等工作,不断吸纳行业新力量壮大共建版图。




