算法位操作总结笔记

2023-11-01

算法位操作总结笔记。

1 前言

C/C++语言提供的位运算符有:

运算符 含义 功能
\& 按位与 如果两个相应的二进制位都为1,则该位的结果值为1;否则为0。
| 按位或 两个相应的二进制位中只要有一个为1,该位的结果值为1。
\^ 按位异或 若参加运算的两个二进制位同号则结果为0(假)异号则结果为1(真)
~ 取反 ~是一个单目(元)运算符,用来对一个二进制数按位取反,即将0变1,将1变0。
« 左移 左移运算符是用来将一个数的各二进制位全部左移N位,右补0。
» 右移 表示将a的各二进制位右移N位,移到右端的低位被舍弃,对无符号数,高位补0。

位运算的结果演示:

位运算 或 “|” or 与 “&”and 非 “~” not 异或 “^” xor
操作数1 01010101 11010101 10101010 10000001
操作数2 00101010 10101010 (无) 01111111
也能算结果 01111111 10000000 01010101 11111110

2 用于整数的奇偶性判断

想想,我们要判断一个数的奇偶性,在没用位运算之前我们可以用下列的代码来实现:

template<class Type>
bool Parity(Type value)
{
	if(value % 2 == 0)
		return false;
	else
		return true;
}
//加以优化 
template<class Type>
inline bool Parity(Type value)
{
	return (value % 2 != 0);
}

要知道,上面的代码我们使用的是对2取余,如果操作数value是小数的话,还勉强行得通,但是value是一个上百万的大数,那么这就白白浪费了CPU的大量时间,程序的效率和性能就很差。我们知道任何数在计算机储存中都是以二进制储存的,细心的你就会发现在二进制的最小一位有个特点,为0就是偶数,为1就是奇数,按照这个原理我们根本没必要让我们的CPU大哥白白做那么多的工作,只要一步判断就可以了。接下来就让我们看看位运算的精妙之处!

那么我们的目的就是判断最小位是0还是1,可是我们怎么判断呢?我们要用位运算阿里判断,就是与或非。在上面的复习之中我们只说了位运算的计算方法,并没有说其用处。那么在这里我们用到的就是“与”!与运算特有的一个功能就是判断指定位上的值(0或1)。我们来看下面的表格(与运算)。

操作数1 10101010 01010101 11111111 11111110
操作数2 00000001 00000001 00000001 00000001
运算结果 00000000 00000001 00000001 00000000

我们要注意一下这里的 操作数2 ,它只有最低位是1,其余位都是0,这就是关键所在,操作数1是随机值。我们看看结果只会有两种结果:0或1。这个结果就取决于操作数1的最低位,它为1时就为1,为0时就为0.

“那么我要判断的是第二位呢?”

好!那我们就把操作数2改为 00000010 那么结果就只会有 00000000 或 00000010 其结果取决于第二位。

有了这个基础那么我们来看看怎么用位运算判断奇偶性吧:

template<class Type>
bool Parity(Type value)
{
	if(value & 0x0001 == 0)
		return false;
	else
		return true;
}
//加以优化 
template<class Type>
inline bool Parity(Type value)
{
	return (value & 1 != 0);
}
//在简化 
#define	PARITY(value) (value&1)

使用a%2来判断奇偶性和a & 1是一样的作用,但是a & 1要快好多。

3 判断n是否是2的整数冪

所谓2的整数冪就是指 1(2的0次冪),2,4,8,16,32,64,128,256,512,1024,2048………….等数字,若何判断一个数是否是这样的数呢?我们看看不用位运算的计算方法:

#include "math.h" 
 
template<class Type>
bool IsPowerOfTwo(Type value)
{
	for(int i = 0,l = 8*sizeof(value); i < l ;i++)
	{
		if(pow(2,i) == value)
		{
			return true;
		}
	} 
	return false;
}

在这个算法中,我们使用了一个循环。其原理非常简单就是一一的对比,但是其中还调用了数学函数库,效率大大降低。接下来我们讲讲怎样用位运算来判断。我们首先要研究一下这些数的特性,请看下表(与运算):

2的幂 8 16 32 64
n 00001000 00010000 00100000 01000000
n-1 00000111 00001111 00011111 00111111
与结果 00000000 00000000 00000000 00000000

我们发现 n &(n-1) = 0 我们可以 用逻辑非 !(n&(n-1)) = 1 。那是不是这样就可以了呢,你会发现 !(0&(0-1)) = 1 但是 0并不是 2的正整数冪。我们可以用 逻辑与 (!(n&(n-1) && n) = 1;请看下面的代码:

template<class Type>
inline bool IsPowerOfTwo(Type n)
{
	if(((!(n&(n-1))) && n) == 1)
		return true;
	else
		return false;
}
//简化 
#define	ISPOWEROFTWO(n) ((!(n&(n-1)) ) && n)

4 统计n在二进制中1的个数

朴素的统计办法是:先判断n的奇偶性,为奇数时计数器增加1,然后将n右移一位,重复上面步骤,直到移位完毕。

template<class Type>
inline bool Parity(Type value)
{
	return (value % 2 != 0);
}
 
template<class Type>
inline int CountOne(Type value)
{
	if(value != 0)
	{
		return Parity(value) + CountOne(value >> 1);
	}
	return 0;
}

朴素的统计办法是比较简单的,那么我们来看看比较高级的办法。

举例说明,考虑2位整数 n=11(十进制为3),里边有2个1,先提取里边的偶数位10,奇数位01,把偶数位右移1位,然后与奇数位相加,因为每对奇偶位相加的和不会超过“两位”,所以结果中每两位保存着数n中1的个数,那么把 n 计算之后得到的值为:(10»1)+01 = 01 + 01 = 10, 把10换成十进制就是 2,2就代表 n(3)=11 中有两个1!

相应的如果n是四位整数 n=0111(十进制7),先以“一位”为单位做奇偶位提取:偶数位 0010,奇数位0101。然后偶数位移位(右移1位)再相加:(0010»1)+0101=0110;再用0110以“两位”为单位做奇偶提取:偶数为0100,奇数位0010。偶数位移位(这时就需要移2位)再相加:(0100»2)+0010=0011,因为此时每对奇偶位的和不会超过“四位”,所以结果中保存着n中1的个数:(0100»2)+0010=0011 把0011换成十进制就是3,3就是n(7)=0111中有3个1。

依次类推可以得出更多位n的算法。整个思想类似分治法。

在这里就顺便说一下常用的二进制数:

二进制数 二进制值 用处
0xAAAAAAAA 10101010101010101010101010101010 偶数位为1,以1位为单位提取奇位
0x55555555 01010101010101010101010101010101 奇数位为1,以1位为单位提取偶位
0xCCCCCCCC 11001100110011001100110011001100 以“2位”为单位提取奇位
0x33333333 00110011001100110011001100110011 以“2位”为单位提取偶位
0xF0F0F0F0 11110000111100001111000011110000 以“8位”为单位提取奇位
0x0F0F0F0F 00001111000011110000111100001111 以“8位”为单位提取偶位
0xFFFF0000 11111111111111110000000000000000 以“16位”为单位提取奇位
0x0000FFFF 00000000000000001111111111111111 以“16位”为单位提取偶位

例如:32位无符号数的1的个数可以这样数:

int CountOne(unsigned int n)
{
    //0xAAAAAAAA,0x55555555分别是以“1位”为单位提取奇偶位
    n = ((n & 0xAAAAAAAA) >> 1) + (n & 0x55555555);
    //0xCCCCCCCC,0x33333333分别是以“2位”为单位提取奇偶位
    n = ((n & 0xCCCCCCCC) >> 2) + (n & 0x33333333);
    //0xF0F0F0F0,0x0F0F0F0F分别是以“4位”为单位提取奇偶位
    n = ((n & 0xF0F0F0F0) >> 4) + (n & 0x0F0F0F0F);
    //0xFF00FF00,0x00FF00FF分别是以“8位”为单位提取奇偶位
    n = ((n & 0xFF00FF00) >> 8) + (n & 0x00FF00FF);
    //0xFFFF0000,0x0000FFFF分别是以“16位”为单位提取奇偶位
    n = ((n & 0xFFFF0000) >> 16) + (n & 0x0000FFFF);
 
    return n;
}

看起来似乎采用位运算的代码比朴素方法代码要复杂的多,但是在性能上有着朴素方法无法比拟的优越性,只要四步简单的运算就能达到目的,而朴素方法不是用循环就是递归,这大大降低了CPU的运算性能。

5 对于正整数的模运算(注意,负数不能这么算)

先说下比较简单的:

乘除法是很消耗时间的,只要对数左移一位就是乘以2,右移一位就是除以2,据说用位运算效率提高了60\%。

乘$2^k$ 众所周知: $n«k$。所以你以后还会傻傻地去敲$2566*4$的结果10264吗?直接$2566«2$就搞定了,又快又准确。

除$2^k$众所周知: $n»k$。

那么 $\mod 2^k$ 呢?(对2的倍数取模)

$n \& ((1«k) -1)$

用通俗的言语来描述就是, 对2的倍数取模,只要将数与2的倍数-1做按位与运算即可。

好!方便理解就举个例子吧。

思考:如果结果是要求模$2^k$时,我们真的需要每次都取模吗?

在此很容易让人想到快速幂取模法。

5.1 快速幂取模算法

经常做题目的时候会遇到要计算 $a^b \mod c$ 的情况,这时候,一个不小心就TLE(算法计算超时,ACM题目测试结果常见问题)了。那么如何解决这个问题呢?位运算来帮你吧。

首先介绍一下秦九韶算法:(数值分析讲得很清楚)

把一个$n$次多项式$f(x) = a[n]x^n+a[n-1]x^{(n-1)}+\cdots +a[1]x+a[0]$改写成如下形式:

\[\begin{array}{l} \left.f(x)=a[n] x^{\wedge} n+a[n-1] x^{\wedge}(n-1)\right)+\ldots . .+a[1] x+a[0] \\ =\left(a[n] x^{\wedge}(n-1)+a[n-1] x^{\wedge}(n-2)+\ldots . .+a[1]\right) x+a[0] \\ =\left(\left(a[n] x^{\wedge}(n-2)+a[n-1] x^{\wedge}(n-3)+\ldots \ldots+a[2]\right) x+a[1]\right) x+a[0] \\ =\ldots \ldots \\ =(\ldots \ldots((a[n] x+a[n-1]) x+a[n-2]) x+\ldots . .+a[1]) x+a[0] . \end{array}\]

求多项式的值时,首先计算最内层括号内一次多项式的值,即

$v[1]=a[n]x+a[n-1]$

然后由内向外逐层计算一次多项式的值,即

\[\begin{array}{l} v[2]=v[1] x+a[n-2] \\ v[3]=v[2] x+a[n-3] \\ \ldots \ldots \\ v[n]=v[n-1] x+a[0] \end{array}\]

这样,求 $n$ 次多项式 $f(x)$ 的值就转化为求$n$个一次多项式的值。

好!有了前面的基础知识,我们开始解决问题吧。

由 $(a \times b) \mod c=( (a \mod c) × b) \mod c$ .

我们可以将 $b$先表示成:

$b = a[t] × 2^t + a[t-1]× 2^{(t-1)} +\cdots + a[0] \times 2^0. (a[i]=[0,1]).$

这样我们由 $a^b mod c = a^(a[t] × 2^t + a[t-1] × 2^{(t-1)} + \times a[0] \times 2^0) \mod c$.

然而我们求 $a^{(2^{(i+1)})} \mod c=((a^(2^i)) \mod c)^2 \mod c $ 求得。

具体实现如下:

使用秦九韶算法思想进行快速幂模算法,简洁漂亮

// 快速计算 $(a ^ p) \% m$ 的值

__int64 FastM(__int64 a, __int64 p, __int64 m)
{ 
    if (p == 0) return 1;
    __int64  r = a % m;
    __int64  k = 1;
    while (p > 1)
    {
        if ((p & 1)!=0)
        {
            k = (k * r) % m; 
        }
        r = (r * r) % m;
        p >>= 1;
    }
    return (r * k) % m;
}

http://acm.pku.edu.cn/JudgeOnline/problem?id=3070

6 计算掩码

什么是掩码?掩码是一串二进制代码对目标字段进行位与运算,屏蔽当前的输入位。用于从一个或多个字节中选出的位的集合。 举个例子:

我们有一个IP地址:192.168.1.111 对应二进制:11000000.10101000.00000001.01101111。

我们让这个IP位与:255.255.255.0 对应二进制:11111111.11111111.11111111.00000000。

可以得到子网地址:192.168.1.0 对应二进制:11000000.10101000.00000001.00000000。

在例子中我们通过观察二进制码就知道,这个过程就是拿到IP的前三个字节的数据信息,这里用到的255.255.255.0就是掩码,也就是我们常说的子网掩码。通过子网掩码可以轻松的得到子网地址。那么通过掩码我们就可以轻松的得到多个字节中指定的位的集合。

我们现在有一个需求:获得数$x$的低$n$位的集合。

假设$x = 233, n= 6$,我们就知道计算方法:233的二进制是 11101001,所以结果集为 $11101001 \& 00111111$ = 00101001 十进制为 41。在这个计算中233可以轻易改变,但是 00111111 已经指定 $n = 6$,要可以让$n$也随意改变怎么办呢?

我们用位运算的思维就可以得到 $n = 6$ 时 00111111 可以表示为 $(1 « 6) - 1$.

那么掩码的计算公式就为:$(1 « n) - 1$.

现在根据需求可以写出模版函数如下:

template<class Type>
inline Type LowByte(Type x, int n)
{
	return x & ((1 << n) - 1);
}
//简化 
#define	LOWBYTE(x,n) x & ((x << n) - 1)

如果是高位集合呢?我们只需要把掩码左移就可以了:$n = 6$ 时 $00111111«2$ 公式为:$((1 « 6) - 1)«2$.

template<class Type>  
inline Type HeightByte(Type x, int n)  
{  
    return x & (((1 << n) - 1) << (sizeof(x)-n));  
}  
//简化  
#define HEIGHTBYTE(x,n) x & (((1 << n) - 1) << (sizeof(x)-n))

7 子集

假设我们有一个集合 $mask ={‘c’,‘b’,‘a’}$,要求列出集合的所有子集。我们可以使用位运算思想,把集合的元素的有无看成二进制的0和1那么我们展开举例:

c b a    
0 0 1 1 {‘a’}
0 1 0 2 {‘b’}
0 1 1 3 {‘b’, ‘a’}
1 1 1 7 {‘c’, ‘b’, ‘a’}

枚举出一个集合的子集。设原集合为mask,则下面的代码就可以列出它的所有子集:

for (i = mask ; i ; i = (i - 1) & mask) ;