我的西皮优学习笔记(五)->二进制及其表示法
进制的运算
1、十进制的对比分析
在十进制的数字中,每一列的权都是前一列的10倍,从右到左,每一列的权分别是1,10,100,1000…
看到十进制数的时候会发现其右下角有一个小小的10,这个小小的数称为十进制的c基,也就是说十进制的基是10
例:比如说:2345这个数是个十进制数
我们的一般就是个直接理解2345,这种思想是我们的常识思想,其实它真正的数字意义是在我们学习数字的时候刚开始的思维方式,
两个一千,三个一百,四个10,五个1,拿过来作为机器思想的描述就是:
每一位上的数字乘上他们对应位的权,再将结果加起来得到最终的数值
2、二进制
每一位上的数字只有0和1两个值,最后将多位合并起来就组成了一个二进制数
二进制的基是2
每一列的权从右到左分别是:1,2,4,8,16…,以此类推,也就是说个位的权是20,十位21…等等,同样通过机器的思想去理解
二进制就是:每一位上的数字(0/1)去乘上对应位的权(2的几次方)
1)二进制转换为十进制
个位权对应十进制:1
十位权对应十进制:2
百位权对应十进制:4
千位权对应十进制:8
…
例:1011
描述过来就是:1 * 1+1 * 2+0 * 4 + 1 * 8
通过二进制权对应的十进制的数来实现二进制到十进制的转化
2)十进制转二进制
比如说:给定十进制数84需要转换为二进制数
那么84中含的二进制的最大权就是64
所以64这一位上的数是1
然后 通过 84+64 = 20
64的下一位上的权是32,但是20<32,所以32这一位上的数就是0
32的下一位上的权是16,同时20>16,所以16这一位上的数就是1
以此类推
得到的 84》》》1010100
3、半字节,字节和字
对于二进制 8位一组称为字节,它能表示2^8 = 256 个数字,计算机中存储数据习惯于用字节作为单位,而不是用位作为单位。
4位的一组或者说半个字节称为半字节,能表示 2^4 = 16个数字(也就是一个十六进制数占用一个半字节),不常用,1024个字节称为1千字节(kilobyte ,KB),1024比特称为1千比特(kilobit,Kb或者Kbit),相似的MB,Mb称为兆字节,和兆比特,GB和Gb称为吉字节和吉比特。内存的容量一般用字节作为单位,但是信息传输率一般用比特/秒,作为单位。
对于微处理器来说,处理的一块数据称为字,字的大小取决于微处理器的结构。64位的处理器表示对64位的字进行操作,32位的处理器
对于32位的字进行处理。比较简单的微处理器也有8位或者16位字的
**最低有效位:**在一组位中,权为1的那位称其为最低有效位(lsb)
**最高有效位:**这组的位的另一端称为最高有效位(msb)
对于一个字来说可以通过十六进制来表示,这样就可以通过最低有效字节和最高有效字节来表示:
比如说:DEAFDAD8
最低有效字节是D8
最高有效字节是DE
4、二进制的溢出:
进行十进制的加法运算的时候经常会发生一个情况就是进位,比如说两个千位极的数相加就有可能生成一个万位级的数,但是正常在进行十进制的加法的时候并不会对这个有什么疑惑,因为十进制的数字加法一般是数字长度可变的,但是对于二进制的加法来说并不一样,一般在操作二进制数的时候都是操作的定长的数字。
比如说在两个四位的二进制数相加的时候,就有可能会产生一个五位的二进制数,但是用于接收这个结果的还是四位的长度,那么此时就会产生溢出(overflow),这个时候会将生成的第五位抛弃。从而产生了一个不正确的结果。
5、有符号的二进制数
二进制用于表示数当然是可以表示正负的,之前我们一直在考虑的是表示正数的无符号数(unsigned),那么就存在可以同时表示正数和复数的有符号数(signed),而用于表示有符号的二进制数的表示方法常用的有两种:
- 带符号的原码
- 带符号的补码
1)带符号的原码
将一个N位的二进制数进行区域设置,从左数的第一位,也就是最高位作为符号位,剩下的N-1位置为数值位,表示当前二进制数数值的绝对值。
其中符号位上:
- 0表示正数
- 1表示负数
存在的问题就是,普通的二进制数运算无法在带符号的原码下完成,比如说,-5(10)和5(10)相加的结果理应是0,但是用带符号的二进制原码去计算:
1101(2) + 0101(2) = 10010(2)
这样的计算结果很明显是错误且不合道理的。
表示范围:[-2(N-1)+1,2(N-1)-1]
通过带符号的原码表示的时候0有两个表示方法:+0和-0 。同一个数字有两种不同的表示方法可能会造成麻烦。
2)带符号的补码
对于补码来说最高位的权是-2(N-1),而不是2(N-1):
因为对于二进制的补码来说正数的最高位是0,0111…11(2) = 2^(N-1) -1,复数的最高位是1,1000…000(2) = -2(N-1)。所以说最高位的权表示的是-2^(N-1),相应的最高位就可以作为符号位,因为正数的最高位都是0,负数的最高位都是1.
而数值位在转换的时候也不一样:
无符号二进制数转换成有符号的二进制补码应该这样进行,首先将数扩一位,然后设置符号位,然后对对数据的每一位取反,然后在数据的最低位+1,因为二进制的补码表示0位0000000…000,具有唯一的标识方法,所以也可以进行普通的加法。
示例:
+2 的四位二进制补码表示为:0010
-2 的四位二进制补码表示为:1101 -> 1110
计算二进制补码负数的值:
将二进制数1001(2)转换为十进制数:
首先最高位是1,所以这个数是一个负数,然后每位取反 0110,加1 ,0111 ,这个数的十进制表达为7,所以就是-7(10)
将二进制数0010(2) 转换为十进制数:
首先最高位是0,所以这个数一定是一个正数,然后直接进行转换,所以这个数是2(10)
补码的加法运算:
计算 -2(10) + 1(20)
首先2 的二进制补码表达为0010,-2的二进制补码表达为1110(2),1的二进制表达为0001,1的二进制补码表达为0010(2),两数相加,补码表达为1111(0),转换成十进制数,先取反,0000(2),加一,0001,所以计算的结果为-1
计算-7(10) + 7(10)
首先7的二进制表达是0111,7的二进制补码表达是0111(2),-7的二进制补码表达是1001(2),相加等于10000(2),第五位抛弃,剩下的4位就是0000(2).
综上补码的运算有以下这么几条原则:
- 当进行N位的数据加法时,第N位的进位,也就是N+1位的结果会被丢弃,就是说,虽然我是进行4位的计算,就是说可以根据直接的数值计算的方式去计算符号位,但是最后这个数如果有第5位直接把第五位丢弃,剩下的数的值就是二进制补码计算最后的值
- 二进制的减法计算用补码去表示就是,将二进制的负数表示成补码,然后和第一个操作数的补码进行相加。
- 四位二进制数补码虽然是四位的,其实表示的范围是[-2(N-1),2[N-1]]
- 计算0的二进制补码的时候,就是将所有的二进制位取法,111…11(2),然后+1,最后舍弃掉最高位,因此0是唯一的,这和原码的系统不同,补码中0没有-0这一种表达方式,因此0的表达是唯一的,被认为是正数,因为它的符号位是0
3)带符号的反码
对于一个二进制数来说,如果这个二进制数是正数,那么它的反码就是它本身,但是如果这个二进制数是负数,那么它的反码就是在其原码的基础上,符号位不变,其余的各个位取反。
比如说:
1 的原码是 0001 ,它的反码是 0001
-1 的原码是1001, 它的反码是1110
两者相加:1 + (-1) = 0001 + 1110 = 1111(2) 然后取反 = 1000 = -0
对于反码的计算来说,结果的真值部分也就是数值部分是正确的,但是问题就出现在0这个特殊的数值上,它有100000和00000这样的两种表达方式,于是才出现了补码来解决这样的问题。
出现这样问题的原因是:
首先回顾一下人脑的计算方式,在人脑中不管是几进制都会根据符号判断加减运算,然后对真值区域进行加减,到那时对于计算机来说,加减乘除作为最基本的运算,要设计的尽可能的简单,让计算机去“辨别”符号位显然是一种非常复杂的设计,于是设计出能将符号位也参与运算的方法。根据运算原则的话,减去一个数相当于加上这个数的负数,所以计算机只有加法没有减法就会极大的遍历计算机运算的设计
4)小结
各种码之间的相互转换:
- 原码、补码、反码的正数表达都一样不需要转换
- 负数的原码转反码:符号位不变,真值位各位取反
- 负数的反码转原码:符号位不变,真值位各位取反
- 负数的原码转补码:符号位不变,真值位取反,末尾+1,舍掉溢出位
- 负数的补码转原码:符号位不变,真值位取反,末尾+1,舍掉溢出位
- 负数的反码转补码:末尾+1
- 负数的补码转反码:末尾-1(这里的反码是补码和反码指向的同一个原码的反码,而不是补码的反码)