Skip to content

JEP 227: Unicode 7.0

摘要

升级现有的平台 API,以支持Unicode 标准7.0 版本

目标

主要在以下类中支持最新的 Unicode 版本:

  • java.lang包中的CharacterString类,以及
  • java.text包中的BidiBreakIteratorNormalizer类。

非目标

该 JEP 不会实现以下两个相关的 Unicode 规范:

  • UTS #10,Unicode 排序算法,以及
  • UTS #46,Unicode 国际化域名(IDNA)兼容处理。

动机

Unicode 是一个行业标准,因此 Java 支持最新版本非常重要。

描述

Java SE 8 支持Unicode 6.2

此次升级将包括改进的双向文本行为,该行为在Unicode 6.3中引入,能够更好地显示阿拉伯语和希伯来语等语言的文本。Unicode 7.0本身将增加约 3000 个字符和 20 多个字符集。

测试

我们需要验证相关类是否正确使用了最新的 Unicode 数据。

风险和假设

如果在 JDK 9 时间范围内发布 7.0 之后的版本,则很可能会更新此 JEP 以指定该版本。

依赖关系

此功能依赖于 Unicode 联盟的Unicode 标准