有关区块链的数据表格分析
A. 如何分析区块链数据
如果需要链上数据分析,步骤如下:1.获取数据。基本上每个主流区块链都有它们自己的区块链数据浏览器,部分其它浏览器也是提供了数据的API接口。所以用户可以直接调用接口来获取数据,然后进行数据清洗、数据落库。也可以搭建一个区块链全节点,然后通过访问本地全节点的方式来获取并解析链上数据,然后依次清洗、落库。2.给地址打标签。区块链是一个巨大的匿名系统,数据分析最重要的就是需要知道这些匿名地址直减的关联,所以需要尽快找到地址背后的信息。第一种方法是用户可以选择从公开的数据源获取地址,第二张是通过充值的方法来获取地址标签,根据交易所提供的充值地址就可以追溯到交易所的热钱包地址甚至是冷钱包地址。第三种则是根据前两种方法获得的地址标签来预测未知地址的标签。3.进一步的数据分析或运用。用户可以针对这些数据做出链上资金的流向监控、大额转账的预警或者是建立数字货币的反洗钱系统。
我们通过以上关于如何分析区块链数据内容介绍后,相信大家会对如何分析区块链数据有一定的了解,更希望可以对你有所帮助。
B. 一张图了解什么是区块链(五分钟带你看懂什么是区块链)
简单易懂地介绍什么是区块链区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。广义来讲,区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。
比特币、莱特币、普银、以太币等数字加密货币的底层技术都是区块链,他们都只是区块链的一种应用。
什么是区块链?一幅漫画让你看懂(小白必看)
“区块链”一词其实在早期的密码学圈子里,对于比特币的底层技术就是称为“比特币”,英文则用大写的B开头的Bitcoin指比特币这个网络系统或者网络协议。
但是由于大众的混淆,现在一谈起比特币人们就十分抵触,认为比特币就是违法、骗局、传销的代名词,是互联网金融又一个现象级泡沫!于是乎,人们只好将所有的底层技术(时间戳、工作量证明机制等等等)合并起来,为了跟比特币区分,重新取了个名字叫Blockchain,翻译过来就成了“区块链”,这才有了“区块链”一词的出现。
区块链不是一个单一的技术,而是一系列技术的集合。
那区块链到底应该如何理解呢?我们首先用大家都爱谈的恋爱,举个简单的例子。建立一个简单的区块链模型,那么在这个区块链模型里面谈恋爱将会出现一下情况:
未来所有适龄男女恋爱,结婚的承诺全过程都被其他所有适龄男女共识,两个人在一起发生的所有故事就会形成区块。
其他所有男女就是链,如果有第三者来插足或自身违背另一半,其他人都能看到,以后就再也找不到对象了。
区块链准确的说就是“全中心”体系,就是链上的每个节点都是中心。
试婚男女谈恋爱,晒朋友圈,秀恩爱,承诺相爱一生一世并被其他所有适婚男女所知就是区块链的应用。如果有一天某一方违背诺言,不要以为删除照片就有用,因为桩桩件件都被所有适婚男女记录在案。
不可删除,不可更改,这就是区块链技术。
区块链是什么通俗解释,一张图看懂区块链区块链是什么通俗解释,一张图看懂区块链
区块链是最近一个比较火热的话题,很多人都在讨论区块链的问题,最近国内也有一些公司开始用区块链的技术开发了一些产品,区块链是用于比特币的一种底层技术,这正式因为比特币的大火让很多人关注到了比特币,但有很多人对于区块链是什么还并不了解,下面就给我来解释一下区块链。
比特币是很多人比较关注的数字货币,而比特币的底层技术就是区块链,区块链是一种计算机技术,是一种新型的应用模式。区块链就好比是一个大的数据库账本,在这个大的账本上记录了所有的交易情况,而记录这个账本的人跟传统的记账有很大区别,传统记账通常是由专门的记账方进行操作,例如淘宝、天猫是阿里巴巴进行记账的,微信交易是由腾讯记账的,而区块链是由全民参与记账,每个参与记账的人入手都有一个账本。
举例来给大家说明,例如A想找B借款1万元,B想将钱借给A,但是又担心A借钱后赖账不还,因此在借钱时会找第三方的公证人,由公证人帮忙B将这笔账给记下来,这种就是传统的记账方式,靠第三方来获取信任,记账的账本是在第三方手中的,这种记账方式存在第三方篡改账本的可能性,而去中心话的意思就是在借款时不需要公证人,不需要依靠第三方来获取信任,去中心化的形势就好比B给A借钱时,B拿着大喇叭喊”A找我借了一万元钱,你们帮我记下账“这个时候,大家都会拿着自己手上的账本将这笔账给记录下来,每个人都有一个账本,可以避免账本被篡改的可能。
什么是区块链概念?区块链究竟是什么?三分钟读懂!2019年10月25日,新闻联播传递出一个非常重要的信号:国家要大力发展区块链。之后,区块链简直就是网红,大街小巷都飘荡着“区块链“的身影。实际上,很多科技企业早已在区块链技术上布局。
尽管说区块链很火,但是很多人对于区块链并不是很了解。
区块链是什么呢?
我们先看一下度娘是怎么解释的。网络显示:区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。
区块链为什么会被叫做区块链呢?
区块链是由一个个的区块链接而成,而区块是一个一个的存储单元,记录了各区块节点的交流信息,区块很像数据库的记录,每次写入数据,就是创建一个区块。而随着信息交流的扩大,一个区块与一个区块相继续,形成的结果就叫区块链。
区块链的特点有哪些呢?
区块链主要有以下几个方面的特点:
1、去中心化:在区块链的系统中,每一个节点都有同等的权利和义务,这里没有中心管制。去中心化很好的建立了彼此之前的信任联系,尽管没有一个中央管理机构,但是人们之间可以相互协作相互信任。这主要应用了区块链分布式账本技术。
2、开放性:区块链的数据对所有的人是开放的,除了一些加密的信息不被开放之外,所有人都可以在这里查到数据。
3、独立性:整个区块链系统不依赖其他第三方,所有节点能够在系统内自动安全地验证、交换数据,不需要任何人为的干预。
4、安全性:区块链具有一定的安全性,不可篡改性。因为区块链系统中大家手里都是一样的账本,如果有人想篡改的话,那么只有在控制了超过51%的记账节点,才有可能伪造出一条不存在的记录。当然了,这基本上是不可能的。这主要是源于区块链的核心技术:共识机制,共识机制具备“少数服从多数”以及“人人平等”的特点。
5、匿名性:很多人觉得区块链这么开放,这么透明,是不是我们就没有隐私了?其实不是,虽然说在区块链中的交易信息是公开透明的,但是账户的身份信息是被进行加密的,只有得到了授权,才能访问。
现在给大家讲一个故事,帮助大家更好的理解区块链。
家里一共三口人,爸爸妈妈和哥哥弟弟。去年的时候,家里的账本是由爸爸来负责的,家里所有的进账以及支出都是爸爸一个人在负责。
然而双十一那天,一向节俭的妈妈想在某宝上给自己买一件漂亮的衣衣,一查账本,发现不对劲儿。按理说除了存银行和理财的一些钱,家里的日常消费的的钱的去向都在这个账本上,但是怎么看怎么都不对。有的消费明明没有,却被记录在内。
后来,爸爸主动招供,说是自己忍不住买了一包烟。
后来妈妈改了策略,全家人都记账,每个月的消费支出大家都记在自己的账本上。每当家里产生了一笔交易或者消费的时候,妈妈都会喊一声,记账啦,大家就都把交易记载自己的账本上。这就是去中心化记账模式,人人都是中心,人人手里都有账本。
而之前的爸爸记账模式就是中心化记账,如果爸爸一个人想做手脚,很难有人看得出来,而去中心化记账模式很好的解决了中心化记账的弊端,如果爸爸想篡改账本的话,非常难。
比如说,爸爸如果想从账本里拿点儿钱再偷偷买烟的话,钱的数量是有限的,而想拿钱就得改改账本,但是光篡改自己的账本是不行的,他得把包含他在内的三个人的账本都改掉。而这无疑是比登天还难。
所以,很多次爸爸动了抽烟的念头之后,但是无奈现状如此,只得放弃这个念头。
区块链和比特币是不是一回事儿呢?
实际上,区块链和比特币并不是一回事儿,它只是比特币的底层技术,比特币是区块链第一个应用的数字货币而已。
2008年中本聪第一次提出了区块链的概念,随后几年,成为了电子货币比特币的核心组成部分,作为所有交易的公共账簿。而区块链首先被应用于比特币。
区块链的缘起是解决信任问题,而且,区块链最成功的一个应用是数字货币。比特币可以说是到目前为止区块链最成功的一个应用。
区块链的应用有哪些?
区块链的应用其实很广泛,除了数字货币,比特币未来的应用还是非常广泛的,区块链技术目前已在不同行业得到了广泛的应用。如商品溯源、版权保护与交易、支付清算、物联网、数字营销、医疗等,推动不同行业快速进入“区块链+”时代。
1、支付清算:区块链可摒弃中转银行的角色,实现点到点支付,减少中转费用,加速资金利用率。
2、商品追溯:比如我们在某宝上买一件衣服,我们可以看到这件衣服的前世今生。
3、证券交易:传统的证券交易需要经过四大机构协调工作,效率低、成本高。区块链技术可独立地完成一条龙式服务。
4、供应链:将区块链技术引入供应链系统,系统内部同步信息、可做到对各个环节把控,更好的完成分工协作,便于事后追责。
5、知识产权:版权上链,我们的摄影作品、音乐作品、文学作品等都会成为我们的信息,信息所有权将得以确认,成为我们的财产。
漫画图解什么是区块链漫画图解:什么是区块链
什么是区块链?
区块链,英文Blockchain,本质上是一种去中心化的分布式数据库。任何人只要架设自己的服务器,接入区块链网络,都可以成为这个庞大网络的一个节点。
区块链既然本质是数据库,里面究竟存储了什么东西呢?让我们来了解一下区块链的基本单元:区块(Block)。
一个区块分为两大部分:
1.区块头
区块头里面存储着区块的头信息,包含上一个区块的哈希值(PreHash),本区块体的哈希值(Hash),以及时间戳(TimeStamp)等等。
2.区块体
区块体存储着这个区块的详细数据(Data),这个数据包含若干行记录,可以是交易信息,也可以是其他某种信息。
刚才提及的哈希值又是什么意思呢?
想必大家都听说过MD5,MD5就是典型的哈希算法,可以把一串任意长度的明文转化成一串固定长度(128bit)的字符串,这个字符串就是哈希值。
而在我们的区块链中,采用的是一种更为复杂的哈希算法,叫做SHA256。最新的数据信息(比如交易记录)经过一系列复杂的计算,最终会通过这个哈希算法转化成了长度为256bit的哈希值字符串,也就是区块头当中的Hash,格式如下:
区块与Hash是一一对应的,Hash可以当做是区块的唯一标识。
不同的区块之间是如何进行关联的呢?依靠Hash和PreHash来关联。每一个区块的PreHash和前一个区块的Hash值是相等的。
为什么要计算区块的哈希值呢?
既然区块链是一个链状结构,就必然存在链条的头节点(第一个区块)和尾节点(最后一个区块)。一旦有人计算出区块链最新数据信息的哈希值,相当于对最新的交易记录进行打包,新的区块会被创建出来,衔接在区块链的末尾。
新区块头的Hash就是刚刚计算出的哈希值,PreHash等于上一个区块的Hash。区块体的Data存储的是打包前的交易记录,这部分数据信息已经变得不可修改。
这个计算Hash值,创建新区块的过程就叫做挖矿。
用于进行海量计算的服务器,叫做矿机。
操作计算的工作人员,叫做矿工。
计算哈希值究竟难在哪里?咱们来做一个最粗浅的解释,哈希值计算的公式如下:
Hash=SHA-256(最后一个区块的Hash+新区块基本信息+交易记录信息+随机数)
其中,交易记录信息也是一串哈希值,它的计算涉及到一个数据结构MerkleTree。有兴趣的小伙伴可以查阅相关资料,我们暂时不做展开介绍。
这里关键的计算难点在于随机数的生成。猥琐的区块链发明者为了增大Hash的计算难度,要求Hash结果的前72bit必须都是0,这个几率实在是太小太小。
由于(最后一个区块的Hash+新区块基本信息+交易记录信息)是固定的,所以能否获得符合要求的Hash,完全取决于随机数的值。挖矿者必须经过海量计算,反复生成随机数进行“撞大运”一般的尝试,才有可能得到正确的Hash,从而挖矿成功。
同时,区块头内还包含着一个动态的难度系数,当全世界的硬件计算能力越来越快的时候,区块链的难度系数也会水涨船高,使得全网平均每10分钟才能产生出一个新区块。
小伙伴们明白挖矿有多么难了吧?需要补充的是,不同的区块链应用在细节上是不同的,这里所描述的挖矿规则是以比特币为例。
区块链的应用
比特币(BitCoin)的概念最初由中本聪于2008年提出,而后根据这一思路设计发布了开源软件以及建构其上的P2P网络。比特币是一种P2P形式的数字货币。点对点的传输意味着一个去中心化的支付系统。
什么是P2P网络呢?
传统的货币都是由中央银行统一发行,所有的个人储蓄也是由银行统一管理,这是典型的中心化系统。
而比特币则是部署在一个全世界众多对等节点组成的去中心化网络之上。每一个节点都有资格对这种数字货币进行记录和发行。
至于比特币底层的数据存储,正是基于了区块链技术。比特币的每一笔交易,都对应了区块体数据中的一行,简单的示意如下:
交易记录的每一行都包含时间戳、交易明细、数字签名。
表格中只是为了方便理解。实际存储的交易明细是匿名的,只会记录支付方和收款方的钱包地址。
至于数字签名呢,可以理解为每一条单笔交易的防伪标识,由非对称加密算法所生成。
接下来说一说比特币矿工的奖励:
比特币协议规定,挖到新区块的矿工将获得奖励,从2008年起是50个比特币,然后每4年减半,目前2018年是12.5个比特币。流通中新增的比特币都是这样诞生的,也难怪大家对挖掘比特币的工作如此趋之若鹜!
区块链的优势和劣势
区块链的优势:
1.去中心化
区块链不依赖于某个中心节点,整个系统的数据由全网所有对等节点共同维护,都可以进行数据的存储和检验。这样一来,除非攻击者黑掉全网半数以上的节点,否则整个系统是不会遭到破坏的。
2.信息不可篡改
区块内的数据是无法被篡改的。一旦数据遭到篡改哪怕一丁点,整个区块对应的哈希值就会随之改变,不再是一个有效的哈希值,后面链接的区块也会随之断裂。
区块链的劣势:
1.过度消耗能源
想要生成一个新的区块,必须要大量服务器资源进行大量无谓的尝试性计算,严重耗费电能。
2.信息的网络延迟
以比特币为例,任何一笔交易数据都需要同步到其他所有节点,同步过程中难免会受到网络传输延迟的影响,带来较长的耗时。
几点补充:
1.本漫画部分内容参考了阮一峰的博文《区块链入门教程》,感谢这位大神的科普。
2.由于篇幅有限,关于MerkleTree和非对称加密的知识暂时没有展开细讲,有兴趣的小伙伴们可以查阅资料进行更深一步的学习。
C. POA(Proof of Activity)区块链共识算法
POA(Proof of Activity)算法是一个区块链的共识算法,基本原理是结合POW(Proof of work)和POS(Proof of stake)算法的特点进行工作,POW算法和POS算法的具体内容可以参考:
POW算法 : https://www.jianshu.com/p/b23cbafbbad2
POS算法 : https://blog.csdn.net/wgwgnihao/article/details/80635162
POA算法相比于其他算法可以改进网络拓扑,维持在线节点比例,需求更少的交易费同时减少共识算法过程中的能量损耗。
POA算法需求的网络中同样包含两类节点,矿工和普通参与者,其中普通参与者不一定一直保持在线。POA算法首先由矿工构造区块头,由块头选出N个币,这N个币的所有者参与后续的校验和生成块的过程。
从这里可以看到POA算法不仅与算力有关,后续的N个参与者的选举则完全由参与者在网络中所拥有的币的总数量决定。拥有越多币的参与者越有机会被选为N个后续的参与者。而后续N个参与者参与的必要条件是这N个参与者必须在线,这也是POA命名的由来,POA算法的维护取决于网络中的活跃节点(Active)。
POA算法的一个理想的基本流程是,类似于POW协议,矿工构造出一个符合难度要求的块头,通过矿工得到的块头计算衍生出N个币的编号,从区块链中追溯可以得到这几个币目前所述的参与者。矿工将这个块头发送给这N个参与者,其中前N-1个参与者对这个块进行校验和签名,最后第N个参与者校验并将交易加入到该块中,将这个区块发布出去,即完成一个区块的出块。
一个理想过程如下图所示:
在实际运行中,无法保证网络上所有参与者都在线,而不在线的参与者则无法进行校验和签名,这个无法被校验和签名的块头则会被废弃。
即在实际运行中,应该是一个矿工构造出块头后广播给各个参与者签名,同时继续重新构造新的块头,以免上一个块头衍生的N个参与者存在有某一个没有在线,而导致块头被废弃。
因此,在这种情况下,一个块是否被确认不仅与矿工的计算能力有关同时也与网络上的在线比例有关。
与纯POW相比,在与比特币(POW)同样10分钟出一个块的情况下,POA由于会有参与者不在线而产生的损耗,因此,10分钟内矿工可以构造的块的数量会更多,即块头的难度限制会降低,那么矿工在挖矿过程中会造成的能量损耗也会降低。
与纯POS相比,可以看到POA的出块流程并不会将构造区块过程中的相关信息上链,可以明显减少区块链上用于维护协议产生的冗余信息的量。
本节对上诉协议中一些参数设置进行分析
在矿工构造出块头后对块头进行校验和区块构造的N个参与者的数量选定比较类似于比特币中每一个块的出块时间的选取。比特币中选择了10分钟作为每一个块的期望出块时间并通过动态调节难度来适应。
这里N的取值同样可以选择选定值或者动态调节。动态调节需要更加复杂的协议内容,同时可能会带来区块链的数据膨胀,而复杂的协议也增加了攻击者攻击的可能性。另外暂时没有办法证明动态调节可以带来什么好处。静态调节在后续的分析(4 安全分析)中可以得到N=3的取值是比较合适的。
从上面的描述可以看到,构造新的区块的除了矿工还有从块头中衍生出来的N个币所有者。在构造出一个新的区块后,这些参与者同样应该收到一定的激励,以维持参与者保持在线状态。
矿工与参与者之间的非配比例与参与者的在线状态相关。给予参与者的激励与参与者保持在线状态的热情密切相关,越多参与者保持在线状态,能更好地维持网络的稳定。因此,可以在网络上在线参与者不够多的时候,提高参与者得到的激励分成比例,从而激发更多的参与者上线。
如何确定当前参与者的在线情况呢?可以最后第N个参与者构造区块时,将构造出来但是被废弃的块头加入到区块中,如果被丢弃的块头数量过多,说明在线人数过低,应当调节分成比例。
同时最后第N个参与者与其他参与者的分成同样需要考虑,第N个参与者需要将交易加入区块中,即需要维护UTXO池,同时第N个参与者还需要将被丢弃的块头加入新构建的区块中。
为了激励其将废弃区块头加入新构建的区块中,可以按照加入的区块头,适当增加一点小的激励。虽然加入更多的区块头,可以在下一轮的时候增加分成的比例,应当足够激励参与者往区块中加入未使用的块头了(这里参与者不可能为了增加分成而更多地加入区块头,每一个区块头都意味着一位矿工的工作量)。
一个参与者如果没有维护UTXO池则无法构造区块,但是可以参与前N-1个的签名,因此为了激励参与者维护UTXO池,作为最后一个构造区块的参与者,必须给予更多的激励,比如是其他参与者的两倍。
从3.2的描述中可以知道一个用户必须在线且维护UTXO池才可能尽可能地获得利益。这种机制势必会导致一些用户将自己的账户托管给一个中心化的机构。这个机构一直保持在线,并为用户维护其账户,在被选为构造区块的参与者时参与区块的构建并获取利益。最后该机构将收益按照某种形式进行分成。
上面说到参与者必须用自己的密钥进行签名,而托管给某个机构后,这个机构在可以用这个密钥签名构造区块的同时,也有可能使用这个密钥消费用户的财产。这里可以采用一种有限花销的密钥,这个密钥有两个功能,一个是将账户中的部分财产消费出去,另一个是将所有财产转移到一个指定账户。在托管的时候可以使用这个密钥,在被通知部分财产被花费后可以立即将所有财产转移到自己的另一个账户下,以保证财产的安全。
从上面的分析可以看到,POA的安全性与攻击者所拥有的算力和攻击者所拥有的股权有关。假设攻击者拥有的在线股权占比为 ,则攻击者的算力需要达到其他所有算力的 倍才能达成分叉。假设攻击者股权总占比为 ,网络中诚实用户的在线比例为 ,则攻击者的算力需要达到其他所有算力的 倍才能达成攻击。
攻击的分析表格如下:
从上文的分析可以看到,POA算法相比于其他算法可以改进网络拓扑,维持在线节点比例,需求更少的交易费同时减少共识算法过程中的能量损耗。同时,PoA协议的攻击成本要高于比特币的纯PoW协议。
参考文献:Proof of Activity: Extending Bitcoin’s Proof of Work via Proof of Stake