2022年1月28日,国际电信联盟标准化局(ITU-T)在第16研究组的全会上正式冻结了中国信息通信研究院(以下简称“中国信通院”)云计算与大数据研究所牵头制定的两项数字人标准——ITU-T F.748.15 “Framework and metrics for digital human application system”(数字人应用系统基础框架和评测指标)和ITU-T F.748.14 “Requirements and evaluation methods of non-interactive 2D real-person digital human application system”(非交互式2D真人形象类数字人应用系统指标要求和评估方法)。两项国际标准即将于近期发布。

数字人作为一种全新的生成式人工智能技术,市场前景广阔,目前已经在传媒内容播报、金融客户服务、电商直播带货等场景孵化出典型应用。一方面能够推动数字内容生产从劳动密集型向科技密集型转变,打造数字内容生成新范式;另一方面可塑造视听双通道的多模态交互体验,有效赋能行业。2021年以来,在元宇宙概念的刺激下,数字人技术应用呈现蓬勃发展态势。但由于技术实力和成本等原因,市场上数字人产品质量良莠不齐,造成各行业对数字人的应用信心不足。

为引导数字人产业健康发展,促进数字人技术、产品进步,2021年4月,中国信通院牵头在ITU-T SG16的Q5(第五课题组——Artificial intelligence-enabled multimedia applications)成功立项了“数字人应用系统基础框架和评测指标”和“非交互式2D真人形象类数字人应用系统指标要求和评估方法”的标准研制项目。这两项标准在研究与编制过程中受到了多方关注,经过与英国、加拿大、俄罗斯、美国、日本等国际专家的深入研讨,最终在2022年1月的SG16全会上就技术内容达成一致,获全会通过,成功冻结。

ITU-T F.748.15聚焦于数字人应用系统,首次明确了数字人(“digital human”)的定义,提出了数字人应用系统的参考框架,并分别从形象、语音、动作、交互处理、多模态输入、多模态输出等维度规范了相应的技术评估指标。该标准作为数字人技术、产品和服务评估指南,可以帮助相关方评估和比较不同的数字人应用系统,对于数字人应用系统研发、选型、测试等都具有很强的指导意义。

ITU-T F.748.14则是面向非交互式2D真人形象类数字人应用系统,定义了2D数字人、2D真人形象类数字人、非交互式数字人的相关概念,并结合ITU-T F.748.15,从形象、语音、动作、多模态输入、多模态输出等维度提出了相应的指标要求以及具体的评估方法。该标准的输出,对指导非交互式2D真人形象类数字人应用系统的设计与开发,促进相应产品成熟,具有非常深远的意义。

这两项数字人国际标准均由中国信通院牵头并担任编辑人(Editor)。其评测指标和测试方法均采纳了中国人工智能产业发展联盟及内容科技产业推进方阵的评估规范和中国通信标准化协会行业标准的相关内容,参与单位包括百度、腾讯、南京新一代人工智能研究院有限公司、凌云光、网易、商汤、央视网、科大讯飞、北京航空航天大学等20余家企业、高校及科研机构。

数字人国际标准的正式冻结,标志着我国在数字人领域评测能力得到了国际认可,是我国数字人科研人员对国际标准化研究的重要贡献,也为我国数字人技术、产品和评测走出国门开辟了道路。

推荐内容