项目简介:

互不兼容的PUA自造字是导致当前生僻字问题的一个重要原因。PUACleaner项目致力于将全国各地在用的PUA自造字转换为国际标准ISO/IEC 10646和强制性国家标准GB 18030中的正式码。

项目特点:

技术价值: 当前社会各机构使用国际编码字符集标准中的用户自定义区(Private Use Area,简称PUA区)的码位自造生僻字,临时解决用字问题。但由于各个机构PUA自造字互不兼容,在涉及人名、地名数据交换和比对时往往导致百姓业务办理失败,已成为一项困扰生僻字群众的民生问题。PUA编码与标准编码的对应转换是解决信息系统生僻字问题的关键一环,本项目可为PUA向标准编码的转换提供一个统一的技术手段,填补空白。

业务价值: 本项目服务于金融、教育、交通、医疗等涉及人名、地名生僻字信息处理的行业机构,为有需要的机构提供开源的PUA编码转换工具,打破国内厂商生僻字解决方案的市场垄断形势,降低全社会解决生僻字问题的成本。

生态价值: 随着数字中国建设的推动,“数据多跑路,百姓少跑腿”,是公共服务行业信息系统建设要实现的目标,这必然要求各个业务系统之间应使用统一的编码字符集标准。本项目指导各机构将曾用或在用的PUA编码转换为国际标准和国家标准编码,有助于解决全社会信息系统生僻字问题,促进软件产业有序健康发展,推动国家语言文字信息化、标准化、规范化建设。