Skip to content

JEP 112: Charset Implementation Improvements | 字符集实现改进

摘要

提高标准字符集和扩展字符集实现的可维护性和性能。

动机

  • 减少已安装字符集的大小

  • 通过在构建时从简单的基于文本的映射表生成字符集实现来降低维护成本

  • 提高编码 / 解码的性能

描述

这是 sun.nio.cs/ext 重新实现项目的第二部分。在 JDK 7 中,大多数字符集(80% 以上)被重新实现以提高可维护性和性能。此 JEP 继续开展以下工作:

  • 重新实现剩余的字符集,主要是基于 JIS_X_0208/0212 的日文字符集和几个 IBM 双字节字符集,如 IBM964 和 IBM33722。

  • 为最常用的双字节字符集实现 sun.nio.cs.ArrayDecoder/Encoder API,以提高 new String(byte[])String.getBytes() 的性能。

  • 提高标准和扩展字符集提供程序的启动 / 访问性能。

测试

需要确保新实现与现有实现(针对每个代码点)完全兼容。将编写在当前测试框架下运行的新自动单元测试,以确保正确性。