来源 | Medium
作者 | arjuna sky kok
整理 / Crying
出品 | Muxi_k & Crying

根据IEEE此前的一项调查,Python已成为最受开发者欢迎的语言之一。由于其对于技术小白天然友好的特性,以及不断更新的新功能。Python越来越受到国内外开发者的喜爱。越来越多被用于独立、大型项目的开发开始使用Python。

20世纪90年代初荷兰人Guido van Rossum为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,作为ABC 语言的一种继承。

之所以选中Python(大蟒蛇的意思)作为该编程语言的名字,是取自英国20世纪70年代首播的电视喜剧《蒙提.派森的飞行马戏团》(Monty Python's Flying Circus)。

对于区块链开发者来说,Python也是十分实用的语言之一。今天,我们就Python开发一个简单的区块链数据结构。

在这篇文章中,一方面我们会对区块链数据结构的基本概念进行讲解,例如哈希的工作原理,另一方面,也会以实际代码来构建一个区块链基本的数据结构,让你对区块链和Python的基础有个基本的理解。

说不多说,下面就进入正题!

                    从哈希函数说起 

在区块链中,数据结构是十分重要的基本组成部分,尤其是比特币。虽然单一的数据结构无法构建成加密数字货币,但理解数据结构对于理解区块链的基本原理是非常有益处的。

但在讲数字结构之前,我们还是先从哈希讲起,以比特币的SHA-256哈希函数为例,讲讲如何利用Python去实现哈希的运算。

哈希函数,又称散列算法,是一种从任何一种数据中创建小的数字“指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。该函数将数据打乱混合,重新创建一个叫做散列值(或哈希值)的指纹。散列值通常用一个短的随机字母和数字组成的字符串来代表。

对于任意长度的消息,SHA256都会产生一个256bit长的哈希值,称作消息摘要。

这个摘要相当于是个长度为32个字节的数组,通常用一个长度为64的十六进制字符串来表示。

来看一个例子:

干他100天成为区块链程序员,红军大叔带领着我们

这句话,经过哈希函数SHA256后得到的哈希值为:

A7FCFC6B5269BDCCE571798D618EA219A68B96CB87A0E21080C2E758D23E4CE9

说回SHA-256,说白了,它就是一个哈希函数。那么我们如何用Python来实现呢?下面代码展示了用Python实现「hello world」的过程:

>>> import hashlib
>>> hashlib. sha256( b"hello world") . hexdigest()
' b94d27b9934d3e08a52e52d7da7dabfac484e fe37a5380ee9088f7ace2efcde9'

看到这里你可能会问,SHA-256中的「256」究竟是什么意思?哈希算法是一个将任意文本转换为一个256位随机二进制字符串的过程。在上面的例子中,「hello world」是一个11位的字符(只算字母),经过哈希运算以后,变成了这样的一串字符:

b94d27b9934d3e08a52e52d7da7dabfac484efe37a5380ee9088f7ace2efcde9

同样,即使我的文本长度不是11位,生成的字符数也是一样的。例如:

>>> import hashlib
>>> hashlib.sha256 (b"I am the best president. Ever.") .hexdigest()
、fba0e 4cc233f9df81278130ed748a31a842bce8f911766b661f8a4f7ddff5341'

在上面例子中,「I am the best president. Ever.」(意为:我是史上最好的总统),哈希运算之后的字符串一样为64位。就算输入的文本是100位,哈希运算后的字符位数也是64位。

之所以这样,是因为字符是16进制的,如果我们把这样的字符串转换为2进制,那么就会得到一个256位的2进制字符串。如下代码所示:

>>>
bin (0xb94d27b9 934d3e08a52e 52d7da7dabfac484efe3 7a5380ee 9088 f7ace2efcde
9)
0b101110010100110100100111101110011001001101001101001111100000100010
100101 001011100101001011010111110110100111110110101011111110101100010
01 0000100111011111110001101111 010010100111 000000011101110100100001 000
100011110111101011 0011100010111011111100110111101001'

这就是SHA-256中,256这个数字的由来。

接下来我们就来看看哈希算法有哪些特征。哈希的特征之一就是「无冲突原则」。这个原则是指要得到一个256位的2进制字符串,显然有不止一个输入可以做到。

因为256位的输出长度是固定的,但输入的长度却没有限制,所以输入的范围要远大于输出,只要能够穷尽输入,就有可能得到2个一样的256位的输出。

话虽如此,不过要找到这样两个输入的难度却很大。即使是输入上改动了一点,输出的结果都会完全不同。如下所示:

>>> hashlib. sha256(b"1"). hexdigest()
' 6b86b273f f34fce19d6b804eff5a3 f5747ada4eaa22f1d49c01e52ddb7875b4b'
>>> hashlib. sha256(b"2"). hexdigest()
'd4735e3a265e16eee03f59718b9b5d03019c07d8b6c51 f90da3a666eec13ab35'
>>> hashlib. sha256(b"3"). hexdigest()
' 4e07408562bedb8b60ce05cldecfe3ad16b72230967de01 f640b7e4729b49fce'
>>> hashlib. sha256(b"11"). hexdigest()
‘4fc82b26aecb47d2868c4efbe3581732a3e7cbcc6c2efb32062c081 70a05eeb8'

所以,想要找到2中一样的输出的唯一方法,是穷尽所有的字幕、数字组合,这几乎无法做到。几率为2的256次方。

这是个多大的数字?展开来就是酱婶儿的:

115792089237316195423570985008687907853269984665640564039457584007913129639936

几乎相当于10的77次方。这是个什么概念?在460亿光年的宇宙内,可见的原子数量也只有10的78次方。这个数字几乎相当于宇宙内的原子数量!

要运算这个数字需要多长时间?以英伟达Geforce 1080 Ti显卡,浮点运算11.3的算力来运算,每个哈希需要运算3000次,以每秒钟3766666666个哈希的速度来运算,找到两个相同的哈希运算结果,需要计算2的128次方个哈希。地球上所有的人一起计算,需要的时间如下:

>>> 2**128 / ( 7000000000 * 3766666666. 6666665)
1.29057787 70705631e+19 

这比地球存在的实时间都要长。

                   用Python创建第一个区块

了解了什么是哈希,我们接着就来说说什么是区块。实际上,区块链就是一个互相连接的序列。我们接下来创建第一个区块,也称为「创世区块」。代码如下所示:

import hashlib, json
block_ genesis= {
'prev_ hash' : None,
'transactions': [1, 3,4, 2]

区块链中会包含交易,交易很好理解,就是谁转了多少钱给谁。我们把区块进行序列,这样它就可以进行哈希运算:

block_ genesis_ serialized = j son. dumps (block_ genesis,
sort_ keys=True) . encode ( 'utf-8' )
block_ genesis_ hash =
hashlib. sha256 (block_ genesis_ serialized) .hexdigest ()

这样,我们就得到了另一个区块,我们姑且称它为「区块2」:

block _2= {
'prev_ hash' : block_ genesis_ hash,
'transactions' : [3, 3, 3,8,7, 12]
}

再对区块2进行哈希运算:

block_ 2_ serialized = json. dumps (block_ 2,sort_ keys=True) . encode ( 'utf-
8' )
block_ 2_ hash = hashlib.sha256(block_ 2_ serialized) . hexdigest ()

得到了「区块3」。

block_3 = {
block 2 hash,prev_ hash' :
nsactions' :: [3, 4,4,8,34]'tran}

再对区块3进行哈希运算,得到了「区块4」。

block——3——serialized = json.dumps(block_3,sort_key=True).encode('utf-8')
block_3_hash = hash;ib.sha256(block_3_serialized),hexdigest()

这样一来,想要确定区块上的数据没有被篡改,我只需要检查最后一个区块的哈希就行了。而不是从创世区块开始检查。这一原理也杜绝了区块链上数据被攒该的可能。

import haahlib, j3on
block_ genesia = {
'prev_ hah': None,
'transactiona': [1, 3,4, 2]
}
block_2= {
'prev haah' : None,
tranaactions': [3, 3, 3, 8,7, 12]
}
block_3={
'prev_ hash' : None,
'transactiona' : [3, 4, 4, 8,34]
}
def haah blocks (block3) :
prev_ hah = None
for block in blocks: 
block['prev_ hash'l = prev _hah
block_ serialized = jaon.dumpa (block, Bort. _keys=Irue) .encode( 'utf-
8'
block_ hash = hashlib. sha256 (block_ serialized) .hexdigeat()
prev hash = block_ haah
return prev hash
print ("Original hash")
print (haah blocks([block genesis, block 2, block _311)
print ("Tampering the data")
block_ geneais[ 'transactiona'lO] = 3
print ("After being campered")
print (haah blocks([block_ geneais, block 2, block 31))

通过以上代码,可以得到下面结果:

Original hash
45eda4f7a7 6bf0f92a0acda2ce4752dfbe167473376f766f22d7ec68501cac40
Tampering the data
After being tampered
27d68dae05428be6aa244869196a481f431 fca6645dd33c3df7a740afa03b7d9

这样,用Python实现简单的区块链开发的演示就结束了。Python是一门强大的语言,区块链是一个强大的信用工具,这两者结合,势必能创造出新的可能性。

怎么样,今天的内容你都学会了吗?还想看哪些技术教程,欢迎留言告诉Crying