人类历史刚跨入 21 世纪,计算机在中国也日益由一种稀罕的事物变成了人们日常生活中不可缺少的家用电器了。但真正使计算机走入寻常百姓家的原因在于计算机中文操作系统的出现,使得中国人真正进入了信息时代。
最初的中文计算机系统中文字符数十分有限,例如 GB2312-80 编码标准仅收录了 6763 个汉字,在实际使用中人们越来越发现,汉字不够用了。这一点倒不难理解,因为虽然人们在实际生活中并不使用过多烦难的汉字,但是作为源远流长的中华文明在 5000 年历史长河中留下了无数历史,地理,科学,文化,生活等等方方面面的资料,许多现在已经不再使用的汉字字符,依然大量保留在这些史籍之中。这些历史文化资料在计算机,信息技术日益发达的今天,数字化是留存他们的非常适合的保存方式。除此之外今天许多的地名也依然保留着中华文明的古老痕迹,人们在起名时也往往因为某个古老的汉字美好寓意而采用他们。
但是,当人们满心欢喜的准备把这些资料数字化存储到计算机时,却发现这时有的汉字却在现有字库中找不到。古籍资料,历史文献中的生僻文字无法输入计算机电子化,数字化,即便是对仍在使用中的地名,人名现有的汉字也是远不够用, 例如,在银行、邮电、保险、报业、公安等行业,经常会碰到生僻的人名、地名,这时就只能用拼音代替或手工贴图, 这些问题使得文档难以处理,给人们的生活平添烦恼。 而古籍整理、辞书出版则会遇到很多缺字,虽然现在可以通过补字的方式增加所缺字符,但是有时补字的工作量很大,而且往往造成和现有字体不能保证完全一致的风格。此外还有其它使用汉字的国家和地区,如日本、韩国、越南、新加坡等,其文化遗产也多以汉字的形式保存。随着信息时代的已经到来,将各种资料,信息转换为电子文档时经常碰到的问题就是:电脑中的汉字不够用。
中国人对汉字的需求仿佛随着时间的推移越来越大, 2000 年一个新的国家标准 GB18030-2000 开始强制执行了。从 GB2132 到 GBK ,从 GBK 到 GB18030 ,标准收录的汉字从 6763 个增加到现在的 27000 多个,人们不禁要问:汉字到底够不够用呢?到底多少汉字才够用呢? 那么让我们首先追溯历史,殷商出土的甲骨文可视为中国文字的渊源,历经几千年的历史演变,汉字无论是在字形、字体,还是数量方面都发生了很大变化,今天,我们用到的汉字有多少呢?《康熙字典》收录了四万七千零三十五字,《汉语大字典》收录了五万六千多个。到目前为止,国际标准组织( ISO )制定国际标准时,共收集到汉字七万多字。那么实际中我们可以推断存在,存在过和使用中汉字字符数目要超过现有有编码的汉字总数。
直到2023年,公布的 Unicode V15.1 共包含 90000+ 字,也正是最新的纳米字库超大字符集字体的全部内容,即纳米字库超大字符集字体基本包含了中、日、韩、越、状等等的主要汉字。
我们制作这些主要是为了能够更好支持许多汉字及生僻字的显示