1.非数值数据(符号数据)的编码
计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化处理,即用二进制编码来表示文字和符号。字符编码就是规定用怎样的二进制编码来表示文字和符号。
(1)BCD码(二一十进制编码)
人们习惯于使用十进制数,而计算机内部多采用二进制数表示和处理数值数据,因此在计算机输入和输出数据时,就要进行由十进制到二进制和从二进制到十进制的转换处理,这是多数应用环境的实际情况。BCD编码方法很多,通常釆用的是8421编码。这种编码较为自然、简单。其方法是用四位二进制数表示一位十进制数,自左至右每一位对应的位权分别是8、4、2、1。值得注意的是,四位二进制数有0000-1111十六种状态,这里我们只取了0000-1001十种状态。而1010-1111六种状态在这种编码中没有意义。
这种编码的另一特点是书写方便、直观、易于识别。
(2)ASCII编码
计算机中的字符按一定的规则用二进制编码表示,一般用8个二进制位进行编码的,目前最普遍釆用的编码是ASCII(AmericanStandardCodeforInformationInterchange)即美国标准信息交换码。
ASCII码编码规则为:8个二进制位的较高位为零,余下的7位可进行编码。7个二进制位表示,共有128个字符,其中有33个控制字符,95个英文字母、数字、标点符号等可显示的字符。
(3)汉字编码
为了适应中文信息处理的需要,1981年我国公布了《信息交换用汉字编码字符集--基本集》,简称GB2312-80,该基本集中共有7445个汉字及符号,其中汉字6763个。根据汉字的使用频度,将6763个汉字分为两级,一级汉字3755个,按拼音顺序排列,二级汉字3008个,按部首排列。
用计算机来处理汉字信息,首先要将汉字代码化,然后输入计算机,并将其转换成汉字内码,才能进行信息处理,处理完毕,再将汉字内码转化成汉字字形码,才能在显示器显示或打印机上打印。
①汉字输入码:用键盘上的数字、字母或其他符号对汉字进行编码编码方案由多种。
数字编码:是用二进制的数字串来表示汉字的输入码,常用的是区位码。它是将GB2312-80基本集中的6763个汉字分成94个区,每个区有94位。区位码输入是用4位十进制数输入汉字所在的区号和位号。该输入法的优点是无重码,且输入码与内码转化方便,缺点是难记忆。
拼音编码:是以汉字读#为基础的输入方法。该输入法的优点是易学,缺点是重码率很高。
字形编码:是用汉字的形状来进行编码,常用的是五笔字形输入法。
②汉字交换码(或称国标码):国标码是基本集规定的另一种汉字输入编码方案。国标码将基本集中的每个汉字或符号用十六进制数表示。每个汉字的国标码用两个字节表示,每个字节的较高位为0。
③机内码(或称内码):是用于汉字信息的存储、交换、检索等操作的机内代码,一般每个字节的机内码用两个字节表示,每个字节的较高位为1,这点正好区别于ASCII码。
④汉字字模码:是用点阵表示的汉字字形代码,它是汉字的输出形式。汉字输出要求不同,点阵多少也不同。点阵越多,汉字越清晰,但每个汉字所占空间也就越大。如存储一个24x24点阵的汉字,占用72个字节,如存储一个32x32点阵的汉字,则占128个字节。
返回目录:通信工程师考试科目综合能力计算机应用
编辑推荐通信工程师考前试题练习: