表意文字补充平面

频道:电子元器件 日期: 浏览:261

表意文字补充平面

本文内容来自于互联网,分享表意文字补充平面

表意文字补充平面  表意文字补充平面,(Supplementary Ideographic Plane,简称SIP),或称第二平面(Plane 2),是Unicode中的一个编码区段。编码从U+20000至U+2FFFF。它是在Unicode里面基本多文种平面以外储存的字符。现时整个平面所配置的,全部都是一些罕用的汉字、或地区的方言用字,如粤语用字及越南语的字喃。

  状态

  已分配和计划分配的编码区段为:

  00020000-0002A6DF:中日韩统一表意文字扩展 B (CJK Unified Ideographs Extension B)Unicode的PDF文件

  0002A6E0-0002F7FF:中日韩统一表意文字扩展 C1 (CJK Unified Ideographs Extension C1)

  还在草拟阶段,预计最快要到2007年才可以公布最后草案(FDAM)。

  0002F800-0002FA1F:中日韩兼容表意文字增补 (CJK Compatibility Ideographs Supplement)Unicode的PDF文件

表意文字补充平面

  扩展B

  扩展B段包含有42,711个新的汉字。根据ISO/IEC JTC1/SC2/WG2/IRG N777号文件,这四万多个汉字分别从以下字典或字集中取得:

  CNS 11643的第4平面到第15平面所收录的30,177个汉字;

  在《汉语大字典》中出现的28,914个未收录汉字;

  在《康熙字典》中出现的18,486个未收录汉字(包括一个在补遗篇出现汉字);

  在北朝鲜的国家标准所收录的5,642个汉字;

  在越南的国家标准所收录的4,232个字喃;

  HKSCS中出现的1,081个未收录汉字;

  《汉语大词典》中出现的553个未收录汉字;

  《四库全书》中出现的522个未收录汉字;

  日本国家工业标准的JIS x 0213第3平面及第4平面的302个未收录汉字;

  1980年代版本的《辞海》中出现的247个未收录汉字;

  大韩民国PKS 5700-3:1998中出现的166个未收录汉字;

  《中国大百科全书》中出现的86个未收录汉字;

  《辞源》中出现的66个未收录汉字;

  北大方正排版系统中出现的65个未收录汉字;

表意文字补充平面

  这堆汉字中重覆的汉字有不少,所以经过整理之后,总数实际上只有42,711个汉字。