各种本地化操作系统使用不同的字符集或代码页。字符集是操作系统所使用的字符地图。有些旧版本的UNIX系统使用一个7比特的字符集,它只包含128 个字符(包括制表符、空格、标点符号、符号、大小写字母、数字和换行符)。7比特ASCII字符集对于多数欧洲语言而言局限性很大,因为它不包含特殊字符。目前的标准是8比特或“扩展”ASCII字符集,它包含256个字符。微软公司的Windows系统使用8比特ASCII字符集,而对于UNIX计算机而言,则有一个ISO(国际标准化组织)标准(ISO 8859-X).

微软和ISO标准非常相似。但是,即使拥有256个字符,8比特ASCII字符集仍然不能容纳所有语言的全部字符。为了解决这一问题,人们又设计了几个不同的8比特字符集,用以容纳一组类似语言中的所有字符。日语、汉语和朝鲜语拥有太多的字符,不能用一个字符集容纳。对于这些语言,要使用16比特字符集(双字节、多字节或可变字节)。为了简化目的,一个叫做Unicode的字符集正得到不断更新。Unicode是一个16比特代码页,包含几乎所有语言中的字符。最新版本的操作系统目前均支持Unicode。