加密、数字签名(摘要)和HTTPS
在信息的传输过程中,存在两个问题:
- 防泄漏:关键信息明文传输,容易被第三方拦截
- 防篡改:防止第三方拦截后,对信息进行篡改
其对应的解决办法就是加密和数字签名。
加密算法
当我们需要把一段信息传输给别人,又不希望其他人看到的时候,就会想到对信息进行加密,把信息加密的方法就是加密算法,分为对称加密和非对称加密。
对称加密
加密和解密都是使用同一个密钥。
常见的对称加密算法有 DES、3DES、AES、RC2、RC4、RC5和Blowfish等。
AES 的意思是 “高级加密标准”(Advanced Encryption Standard),密钥长度可以是 128、192 或 256。它是 DES 算法的替代者,安全强度很高,性能也很好,而且有的硬件还会做特殊优化,所以非常流行,是应用最广泛的对称加密算法。
ChaCha20 是 Google 设计的另一种加密算法,密钥长度固定为 256 位,纯软件运行性能要超过 AES
对称加密优缺点如下:
- 优点:算法公开、计算量小、加密速度快、加密效率高,适合加密比较大的数据。
- 缺点:
- 交易双方需要使用相同的密钥,也就无法避免密钥的传输,而密钥在传输过程中无法保证不被截获,因此对称加密的安全性得不到保证。
- 每对用户每次使用对称加密算法时,都需要使用其他人不知道的惟一密钥,这会使得发收信双方所拥有的钥匙数量急剧增长,密钥管理成为双方的负担。对称加密算法在分布式网络系统上使用较为困难,主要是因为密钥管理困难,使用成本较高。
非对称加密
加密和解密需要使用两个不同的密钥:公钥(public key)和私钥(private key)。公钥与私钥是一对,如果用公钥对数据进行加密,只有用对应的私钥才能解密;如果用私钥对数据进行加密,那么只有用对应的公钥才能解密。
常用的算法有比如 DH、DSA、RSA、ECC 等。
- RSA 可能是其中最著名的一个,几乎可以说是非对称加密的代名词,它的安全性基于 “整数分解” 的数学难题,使用两个超大素数的乘积作为生成密钥的材料,想要从公钥推算出私钥是非常困难的。10 年前 RSA 密钥的推荐长度是 1024,但随着计算机运算能力的提高,现在 1024 已经不安全,普遍认为至少要 2048 位。
- ECC(Elliptic Curve Cryptography)是非对称加密里的 “后起之秀”,它基于“椭圆曲线离散对数” 的数学难题,使用特定的曲线方程和基点生成公钥和私钥,子算法 ECDHE 用于密钥交换,ECDSA 用于数字签名。
比起 RSA,ECC 在安全强度和性能上都有明显的优势。160 位的 ECC 相当于 1024 位的 RSA,而 224 位的 ECC 则相当于 2048 位的 RSA。因为密钥短,所以相应的计算量、消耗的内存和带宽也就少,加密解密的性能就上去了,对于现在的移动互联网非常有吸引力。
- 优点:加密和解密使用不同的钥匙,私钥不需要通过网络进行传输,安全性很高。公钥可以任意分发
- 缺点:计算量比较大,加密和解密速度相比对称加密慢很多。
基于非对称加密的信息传输
现实社会中,有⼈使⽤公钥加密,私钥解密,也有反过来⽤私钥加密,公钥解密,这得看具体的场景。
这里假设Jack持有私钥,并把公钥给Mike,Mike传输信息给Jack的过程如下。
这里有一个问题:Jack的公钥是公开给所有人的,如果有人截获了Mike的信息,然后换成别的信息,重新用公钥加密后给Jack,那么Jack就会得到错误的信息,而误以为是Mike发的。公钥私钥传输,解决了被拦截后的信息泄漏问题,但是没有解决被拦截后的信息篡改。
所以,需要证明信息发送方的身份和发送的数据没有被篡改,这里引入了数字签名的概念。
数字签名
通过加密,可以保证数据在传输中对其他人是不可见的,但是却并不是绝对安全的。信息被拦截后,攻击者可以对信息进行篡改,导致解密后的数据不是原始传输的,甚至针对网站对解密数据的响应,推测出解密的数据或者达到篡改目的。
所以需要一种方式,让信息接受者确认你传输的数据和我收到的一致,在现实中,我们一般通过水印或者签名的方式,在代码的世界里,就是数字签名。
数字签名是对原始传输的信息,通过摘要算法,获得一个比较短的字符并加密后作为原始信息的签名。
摘要算法
实现完整性的手段主要是摘要算法(Digest Algorithm),也就是常说的散列函数、哈希函数(Hash Function)。
摘要算法主要把大量的数据生成一个比较短的字符,便于传输,且不可逆。原信息的任何微小的修改都会引起摘要的变化。评价一个摘要算法的好坏的主要方法是碰撞概率。
常见的hash算法有MD5,sha-1和sha-2(sha-256,sha-224,sha-384)
摘要算法实践
由于摘要算法会出现碰撞,所以会出现重放攻击,如何尽可能的避免重放攻击呢?
- 消息序号
- 消息中加入时间戳,不在接受时间范围内的消息,可视为不可靠
- 添加nonce参数
Nonce是或Number once的缩写,在密码学中Nonce是一个只被使用一次的任意或非重复的随机数值。
在通信之前,接收者先向发送者发送一个一次性的随机数(or字符串),nonce也参与到签名中。
如果是加密的数据传输,nonce也可以由发送方生成。
包含数字签名的信息传递
这次,Mike也有一个公钥和私钥,并且把公钥给了我。这次,mike先把传输的信息用Jack的公钥加密,然后对信息计算hash,将hash使用mike的私钥加密作为签名,上面两个信息一起给Jack。
Jack使用自己的私钥解析信息,然后也计算hash,并利用Mike的公钥揭秘签名,比对二者是否相等,如果一致则可以认为这条信息是Mike传输的原始信息。
中间人攻击
这样就Ok了?NONONO,如果有人黑了Jack的电脑,然后修改了Jack电脑上Mike的公钥换成自己的。这样他依旧可以拦截Mike的信息,然后使用Jack的公钥加密新的信息,使用自己的私钥制作签名,伪装成Mike,这就是中间人攻击。
证书机构:最最后的办法
Mike看到有⼈在伪造他的公钥,想了想,他只能和Jack找了个⼤家都相信的永不作恶的权威的可信机构来认证他的公钥。这个权威机构,⽤⾃⼰的私钥把Mike的公钥和其相关信息⼀起加密,⽣成⼀个证书。
此时,Jack就可以放⼼地使⽤这个权威机构的证书了。Mike只需要在发布其信息的时候放上这个权威机构发的数字证书,然后Jack⽤这个权威机构的公钥解密这个证书,得到Mike的公钥,再⽤Mike的公钥来验证Mike的数字签名。
知名的 CA 全世界就那么几家,比如 DigiCert、VeriSign、Entrust、Let’s Encrypt 等,它们签发的证书分 DV、OV、EV 三种,区别在于可信程度。
DV 是最低的,只是域名级别的可信,背后是谁不知道。EV 是最高的,经过了法律和审计的严格核查,可以证明网站拥有者的身份(在浏览器地址栏会显示出公司的名字,例如 Apple、GitHub 的网站)。
不过,CA 怎么证明自己呢?
这还是信任链的问题。小一点的 CA 可以让大 CA 签名认证,但链条的最后,也就是 Root CA,就只能自己证明自己了,这个就叫 “自签名证书”(Self-Signed Certificate)或者 “根证书”(Root Certificate)。你必须相信,否则整个证书信任链就走不下去了。
操作系统和浏览器都内置了各大 CA 的根证书,上网的时候只要服务器发过来它的证书,就可以验证证书里的签名,顺着证书链(Certificate Chain)一层层地验证,直到找到根证书,就能够确定证书是可信的,从而里面的公钥也是可信的。
HTTPS协议
详细可以看
由于非对称加密的效率比较低,所以实际应用中,只有链接的建立使用非对称加密,后续的数据传输都是对称加密。
整个流程是:访问服务器→服务器通过证书机构私钥CPR加密公钥M,得到证书C→客户端获得服务器的证书C→利用证书机构的公钥CPU获得服务方公钥M→客户端生成随机字符作为对称加密密钥A→公钥M加密A传输到服务器→服务器使用M对应的私钥解密→服务端得到密钥A,后续使用密钥A对称加密传输的数据即可。
这个过程,省略了数字签名。
参考
- 极客时间-左耳听风专栏-《65区块链技术细节:加密和挖矿》