一、云计算
1. 云计算的概念
云计算(Cloud Computing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小任务,然后,通过多部服务器组成的系统进行处理和分析这些小任务得到结果并返回给用户。
简单来说,就是多台计算机一起处理一个大任务,这就需要一个系统(即云计算操作系统,或者分布式系统)来控制这些计算机,并把大任务分解成小任务,分配给这些计算机进行处理(分布式计算)。如果大任务的数据或文件太大,就可以把数据分别存储到每台机器上的磁盘空间(分布式存储)。
最早的云计算是美国电商公司亚马逊在2006年开始做的。为了应对每年的黑色星期五(类似于中国的双11)的巨大流量,亚马逊又买了一堆服务器,但促销活动之后,这些服务器资源就被闲置了,于是他们就想着把服务器租给一些开发者和初创公司。比如某一台服务器CPU 32核、内存128G、磁盘2TB,对于开发者和小公司,用不了这么大规格的服务器,可能CPU 2核、内存4G、磁盘40GB就可以用了,这就需要把大规格的服务器,分成各种小规格的服务器,这种分割的技术就是虚拟化,分割后的就是云服务器。等于多人使用一台大的计算机,每个人都有自己独立的操作系统、CPU(虚拟化后的CPU叫vCPU)、内存、存盘等,相互之间不干扰。可以包年包月购买,也可以按量付费(使用多少付多少钱,像生活中用水用电一样)。如果你的网站访问人数比较多,或者要处理的任务比较大,你也可以购买多台云服务器,让它们进行分布式计算。
如果你的业务,只在某一时段使用人数特别多,大量时间人数比较少,那你可以购买少量云服务器,然后开通弹性伸缩服务,云平台就可以根据业务需求和策略自动调整计算能力,在访问量大的时候,自动扩展出多台云服务器,以保障你的线上业务不会中断。访问量下降的时候,释放掉这些服务器,以节省成本。你可以定时设置扩容和缩容,也可以设置如果服务器资源使用率超出某个阈值或低于某个阈值,自动扩缩容。
你读懂了上面的内容,也就理解了云计算的一些概念:分布式计算、分布式存储、虚拟化、云服务器、按量付费、弹性伸缩。
2. 云计算的发展
亚马逊把闲置的服务器资源租给开发者和创业公司后,发现这比网上卖书赚钱多了,那些创业小公司也省了一大笔启动资金。2006年3月,亚马逊公司正式推出了自家的弹性计算产品-EC2(云服务器),从此奠定了其在云计算领域不可撼动的老大地位。
2006年8月9日,在搜索引擎大会上,谷歌前CEO埃里克·施密特提出了“云计算(Cloud Computing)”的概念。因此,埃里克·施密特也被公认为云计算的提出者。
2008年,微软发布云计算平台,Azure上线,并尝试技术和服务托管化、线上化。于是,有了一个更为人熟知的名词——软件即服务(SaaS)。
再来看看国内的发展历程。
2008年开始,淘宝用户激增,为了缓解服务器资源的压力,2009年,阿里云成立,开始做云计算,2011年开始对外提供服务。2013年,王坚团队终于开发出自主研发的云计算系统”飞天”,阿里云正式投入运营。2013年8月,阿里云实现了将5000台服务器连接成为一台超级计算机,为开发者提供大规模的计算能力,取得了自身技术发展史上的一次划时代的突破!此后的近10年,是淘宝高歌猛进的十年,也是阿里云快速发展的十年。淘宝的秒杀、大促、双11、直播等成功无不得益于阿里背后云的支持。
2010年之后,腾讯云、华为云、金山云、天翼云、UCloud等纷纷入场,云计算在中国进入爆发时期。
国际上,云计算三巨头——亚马逊AWS、微软Azure和谷歌云;国内,目前阿里云处于领先地位,其后群雄逐鹿,竞争激烈。
云计算首先应用和发展于电子商务领域(国外是亚马逊,国内是阿里巴巴),是因为服务资源要扛住大促销时的突发流量,非促销时期,这些资源也不能浪费,要想办法租出去。
3. 公有云、私有云、混合云与多云
云计算在提出之初只有公有云,公有云的厂商们觉得客户不需要保有任何基础设施,直接像水电煤一样使用云计算资源就可以。大家都可以购买使用,数据也都在这些云平台,这就是公有云。
然而,商业的现实和技术企业的理想之间总是存在沟壑,现实是企业需要安全合规、自主可控的基础设施,但又渴望云上弹性、灵活的计算能力(当然前提是不差钱),就自建机房和云平台自己使用,数据存储在自己的服务器上,这就是私有云。2010年,Rackspace与美国航空航天局(NASA)合作创始了开源云平台OpenStack,它包含了一系列用于构筑云计算服务的开源软件。这样,所有拥有硬件基础设施的用户就都可以自己构建云了。
企业业务突增,如果都用私有云,存在成本高、建设周期长的问题,就可以将一部分对于安全合规要求高的应用和数据放在私有云,一部分放在公有云,两者之间可以实现统一管理、监控、调度、数据同步,这就是混合云。
还有一种是多云部署,就是利用多个云供应商的云服务来构建组合云环境,比如同时使用阿里云和腾讯云的云服务,其中一方崩溃了,也不影响业务。云服务通常由私有云和公共云组成,并且通过集成或编排实现了资源的统一管理。
云计算,部署方式的发展趋势是:公有云→私有云→混合云→多云。
4. IaaS、PaaS和SaaS
IaaS(Infrastructure-as-a-Service,基础设施即服务)、PaaS(Platform-as-a-Service,平台即服务)和SaaS(Software-as-a-Service,软件即服务)是云计算服务的三种模式。它们的主要区别在于提供的资源和服务的层级不同。
IaaS 提供的是计算基础设施,包括服务器、存储、网络和数据中心空间。厂商把硬件准备好了,用户可以在上面安装自己的操作系统和应用程序,并完全控制这些基础设施。
PaaS 提供的是一个平台,允许开发者在上面构建、部署和管理应用程序。PaaS通常包括了服务器、存储、网络和操作系统,但不包括应用程序本身。厂商把硬件、操作系统和应用运行所需要的环境准备好了,用户可以在上面部署自己的代码,而无需关心底层的基础设施。
SaaS 提供的是软件应用程序,用户可以通过互联网访问和使用这些应用程序,而无需在本地安装或维护任何软件或硬件。SaaS应用程序通常是由第三方供应商管理和托管的,用户只需支付使用费用。
如果把云计算简单想象成一台大电脑,那么IaaS是直接给你一台裸机,PaaS是安装好操作系统和基础运行环境再给你,而SaaS则很像网吧,你要玩的游戏已经装好在电脑里面,点击图标打开就可以玩了。
云计算的服务模式发展趋势:IaaS→PaaS→SaaS。
二、大数据
1. 大数据概念
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过传统数据库软件工具,在合理时间内达到获取、存储、管理、分析、并整理成为辅助企业经营决策的信息。在过去,大量的数据一般采用随机分析法(抽样调查)进行分析,而现在可以通过大数据技术,对所有的数据进行分析处理。
大数据的5V特点(IBM提出):
-
- 大量(Volume):大数据涉及的数据量巨大,超出传统数据库的处理能力,通常以P(拍字节)、E(艾字节)或Z(泽字节)为计量单位。这些海量数据集合需要采集、存储、管理和分析。
- 高速(Velocity):数据的增长速度极快,要求实时分析和处理,而不是传统的批量处理。这种高速处理是大数据区别于传统数据挖掘的关键特征。
- 多样(Variety):大数据包括多种类型和来源的数据,涵盖结构化、半结构化和非结构化数据,如文本、图像、音频、视频和定位信息等。这种多样性对数据处理技术提出了更高的要求。
- 低价值密度(Value):尽管大数据中包含的信息量巨大,但其中有效的信息相对较少。如何在海量数据中提取有价值的信息,进行分析和预测,是机器学习和人工智能的重要研究方向。
- 真实(Veracity):大数据的真实性指的是其反映现实世界的程度。虽然真实数据不一定完全准确,但它绝不是虚假的。数据分析的基础是真实的数据,这关乎数据的真实性和质量。
福建福州第七届数字中国建设峰会上发布的一份《全国数据资源调查报告》显示,2023年,我国数据产生总量达32.85泽字节(ZB),相当于1000多万个中国国家图书馆的数字资源总量。换算成我们熟悉的GB单位来说,全国每天产生的数据量就达到了惊人的900亿个GB,数据资源规模总量位居世界前列。报告预计,数据生产能力将随着卫星通信、自动驾驶、生成式AI等新技术的规模化应用而持续提升,预计2024年数据生产量增长将超25%。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
2. 大数据技术
大数据处理技术的核心是分布式计算,它将问题分解为多个子问题,并将这些子问题分布到多个计算节点上进行并行处理,从而达到在短时间内处理大量数据的目的。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
数据处理一般分为如下过程:
(1)数据采集与处理(数据从哪来)
数据采集与处理是大数据的关键技术之一,它从互联网、传感器和信息系统等来源获取的大量带有噪声的数据进行预处理,包括数据清洗、填补和规范化等流程,使无序的数据更加有序,便于处理,以达到快速分析处理的目的。
(2)数据存储与管理(数据怎么存)
数据存储与管理是指将处理前或处理后的数据以特定格式记录在计算机内部或外部存储介质上,并对数据进行管理和调用的过程。此过程有助于减少数据孤岛现象,并确保数据的可靠性、安全性、可用性和可扩展性。
(3)数据分析/挖掘(找到有价值的信息)
数据分析是指根据分析目的,用适当的统计分析方法及工具,对收集来的数据进行处理与分析,提取有价值的信息,发挥数据的作用。
数据挖掘是一种计算机辅助技术,用于分析以处理和探索大型数据集。借助数据挖掘工具和方法,组织可以发现其数据中隐藏的模式和关系。数据挖掘将原始数据转化为实用的知识。其目标不是提取或挖掘数据本身,而是对已有的大量数据,提取有意义或有价值的知识。
(4)数据可视化(展示分析结果)
数据可视化是使用图表、图形或地图等可视元素来表示数据的过程。该过程将难以理解和运用的数据转化为更易于处理的可视化表示。数据可视化工具可自动提高视觉交流过程的准确性并提供详细信息,以便决策者可以确定数据之间的关系并发现隐藏的模式或趋势。
三、人工智能
1. 人工智能概念
人工智能就是让计算机像人类一样思考、学习和做出决策。通过利用各种技术(如机器学习、深度学习、专家系统等),人工智能系统可以处理和分析大量数据,自主地学习和优化算法,从而完成各种复杂的任务。人工智能的应用非常广泛,包括但不限于语音识别、图像识别、自然语言处理、智能推荐、智能客服等。
具体的,从技术层面来看(如下图),现在所说的人工智能技术基本上就是机器学习(含深度学习)方面的技术。机器学习、深度学习是人工智能的重要组成。
2. 机器学习
机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能中最具智能特征,最前沿的研究领域之一。自20世纪80年代以来,机器学习作为实现人工智能的途径,在人工智能界引起了广泛的兴趣,特别是近十几年来,机器学习领域的研究工作发展很快,它已成为人工智能的重要课题之一。机器学习不仅在基于知识的系统中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用。一个系统是否具有学习能力已成为是否具有“智能”的一个标志。
机器学习的研究主要分为两类研究方向:
-
- 第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;
- 第二类是大数据环境下机器学习的研究(数据挖掘),该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。
在机器学习领域,主要有三类不同的学习方法:
(1)监督学习
通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。监督学习之所以被称为“监督”,是因为在训练过程中,模型的学习是在一个“监督者”的指导下进行的,这个监督者就是提供标签(或答案)的数据源。
这个“标签”通常是由人工标记的。在监督学习中,训练数据集包含了输入数据和对应的输出标签,这些标签是人们根据自己的知识或经验为每个输入样本提供的。训练过程中,模型通过学习输入与输出之间的关系,来尝试预测新的未见过的输入数据的输出标签。
比如,猫狗图片分类,让机器分辨一张图片是猫还是狗。首先要给机器一些标记好猫、狗的图片,让它识别其中的特征,然后给出没有标记的猫狗图片,机器就能找出哪些是猫,哪些是狗。
(2)无监督学习
直接对输入数据集进行建模,例如聚类。
聚类的目的在于把相似的东西聚在一起,而我们并不关心这一类是什么。因此,一个聚类算法通常只需要知道如何计算相似度就可以开始工作了。
比如给出一些猫狗图片,没有任何标记说明图片是猫还是狗,聚类算法可以根据图片内容的相似性,将这些图片分为2类,但是机器并不知道每一类是什么。
(3)半监督学习
综合利用有标签的数据和没有标签的数据,来生成合适的分类函数。在我们拥有相对较少的标记数据和大量未标记数据的情况下,半监督学习结合了监督学习和无监督学习的优势,可以发挥很好的作用。比如,部分图片标记了猫、狗,一部分没有标记,让机器来学习带标记的图片,然后对没有带标记的图片进行识别哪些是猫,哪些是狗。
3. 深度学习
深度学习(Deep Learning)是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
深度学习在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理、多媒体学习、语音、推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。
4. 人工智能核心应用
(1)自然语言处理
自然语言处理(Natural Language Processing, NLP)旨在帮助计算机理解、解释、生成以及与人类使用的自然语言进行有效交互。自然语言处理的应用领域广泛,包括机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等。
(2)智能语音
人工智能中的智能语音技术是指利用计算机模拟或理解人类语音的技术,它包括几个关键的组成部分:
-
- 语音识别:能够将人类的语音转换成文字。它通过分析声音的波形,识别出语音中的单词和短语,并将它们转换成文本格式,广泛应用于智能助手、自动客服系统、语音输入法等场景;
- 语音合成:能够将文本信息转换成口语化的语音。它通过模拟人类声道的发声机制,生成听起来自然的语音,被用于阅读器应用、导航系统等;
- 语音理解和交互:涉及对语音输入的深层理解,包括识别说话者的意图、情感和语境,使得用户可以通过语音与设备进行自然的对话。
(3)图像识别
图像识别是人工智能领域中一个重要组成部分,指的是通过采用计算机对获取到的图像进行识别、处理、分析和理解,再通过预先设定好的模式根据图像处理结果进行操作的技术。
比如文字识别(印刷体文字、手写体文字等)、数字图像识别、物体识别等,在面部识别、卫星云图、临床诊断、智能安防、工业检测等越来越多领域得到了广泛应用。
5、大模型与生成式AI
大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。
大模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。
大模型采用预训练+微调的训练模式,在大规模数据上进行训练后,能快速适应一系列下游任务的模型。
生成式AI,也称为AIGC(人工智能生成内容),是一种能够基于输入条件或指导生成相关内容的人工智能技术。它通过训练模型和大量数据学习,可以生成文章、图像、音频等具有一定创意和质量的内容。例如,通过输入关键词或描述,生成式AI能够创作出与之相匹配的作品。这种技术在创意工作如写作、编曲、绘画、视频制作等方面展现出巨大的潜力。
大模型和生成式AI的结合,正在推动人工智能向着更智能、更通用的方向发展。它们不仅在提高工作效率和质量方面具有巨大优势,还在不断拓展新的应用场景和可能性。随着技术的不断进步,未来人工智能将在医疗、金融、交通、教育等多个领域得到更广泛的应用和发展。
大模型和小模型
大模型和小模型在应用方面最大的区别是大模型偏向于全能化、通用化,而小模型一般偏向于解决某一垂直领域中的某个具体问题。比如一个图像识别小模型专门训练用来识别车牌号,对车牌号可以有很好的识别精度。但是一个图像识别大模型不仅可以识别车牌号,还可以识别我们生活中碰到的大部分图片。
另外相比小模型来说,大模型通常具有更多的参数,能够学习更复杂的特征和模式。同时大模型的训练数据集也会更大,架构更为复杂,训练起来也需要更高的计算资源。
大模型的分类
按照输入数据类型的不同,大模型主要可以分为以下三大类:
-
- 语言大模型:是指在自然语言处理(NLP)领域中的一类大模型,通常用于处理文本数据和理解自然语言。
- 视觉大模型:是指在计算机视觉(CV)领域中使用的大模型,通常用于图像处理和分析。
- 多模态大模型:是指能够处理多种不同类型数据的大模型,例如文本、图像、音频等多模态数据。
按照应用领域的不同,大模型主要可以分为 L0、L1、L2 三个层级:
-
- L0 通用大模型:指可以在多个领域和任务上通用的大模型。通用大模型就像完成了大学前素质教育阶段的学生,有基础的认知能力,数学、英语、化学、物理等各学科也都懂一点。
- L1 行业大模型:指那些针对特定行业或领域的大模型。它们通常使用行业相关的数据进行预训练或微调,以提高在该领域的性能和准确度。行业大模型就像选择了某一个专业的大学生,对自己专业下的相关知识有了更深入的了解。
- L2 垂直大模型:指那些针对特定任务或场景的大模型。它们通常使用任务相关的数据进行预训练或微调,以提高在该任务上的性能和效果。垂直大模型就像研究生,对特定行业下的某个具体领域有比较深入的研究。
四、物联网
物联网是指通过信息传感设备,按约定的协议,将任何物体与网络相连接,物体通过信息传播媒介进行信息交换和通信,以实现智能化识别、定位、跟踪、监管等功能。
在物联网应用中有三项关键,分别是感知层、网络传输层和应用层。
(1)感知层
感知层是物联网体系结构的底层,主要负责与物理世界进行交互,通过各种传感器和执行器来感知和控制环境中的各种参数。这些传感器可以测量温度、湿度、光照、气压等环境参数,也可以检测物体的位置、速度、方向等运动状态。执行器则负责根据上层指令对物理环境进行相应操作,如开关灯光、调节温度等。
感知层的关键技术包括传感器技术、RFID技术、短距离无线通信技术等。传感器技术的不断发展使得我们能够以更高的精度和更低的成本来感知环境信息。RFID技术则通过无线方式识别特定目标并读写相关数据,为物联网提供了快速、准确的标识和识别手段。短距离无线通信技术如蓝牙、ZigBee等则使得传感器之间以及传感器与网关之间的数据传输变得更加便捷和高效。
(2)网络层
网络层是物联网体系结构的中间层,主要负责将感知层采集到的数据传输到应用层进行处理。这一层包括了各种有线和无线网络技术,如互联网、移动通信网、卫星通信网等。这些网络技术共同构成了一个庞大的数据传输网络,使得物联网设备能够随时随地接入网络并交换信息。
在网络层中,数据的传输和安全性是两个关键问题。为了保证数据传输的可靠性和实时性,物联网通常采用多种传输协议和拥塞控制机制来优化网络性能。同时,由于物联网设备通常需要在无人值守的环境下长时间运行,因此网络安全问题尤为重要。物联网需要采用加密技术、身份认证技术等手段来确保数据传输的安全性和完整性。
(3)应用层
应用层是物联网体系结构的顶层,主要负责将网络层传输来的数据进行处理和应用。这一层包括了各种数据处理技术、云计算技术、大数据技术等,以及基于这些技术开发的各种物联网应用。这些应用涵盖了智能家居、智能交通、智能农业、智能医疗等多个领域,为人们的生活和工作带来了极大的便利和创新。
在应用层中,数据处理和分析是关键环节。物联网设备产生的大量原始数据需要经过清洗、整合、挖掘等处理过程才能转化为有价值的信息。云计算和大数据技术的发展为物联网数据处理提供了强大的计算能力和存储空间,使得我们能够更加高效地处理和分析海量数据。同时,各种人工智能和机器学习算法的应用也使得物联网能够更加智能地识别用户需求、预测未来趋势并做出相应决策。
五、工业互联网
最早由通用电气于2012年提出,随后美国5家行业龙头企业(AT&T、思科、通用电气、IBM和英特尔)联手组建了工业互联网联盟(Industrial Internet Alliance, IIC),对其进行推广和应用。
工业互联网的核心是通过工业互联网平台把原料、设备、生产线、工厂、工程师、供应商、产品和客户等工业全要素紧密地连接和融合起来,形成跨设备、跨系统、跨企业、跨区域、跨行业的互联互通,从而提高整体效率。
工业互联网的本质是使得工业能形成基于全面互联的数据驱动智能,在这个过程中,工业互联网能构建出面向工业智能化发展的三大优化闭环:
-
- (1)面向机器设备/产线运行优化的闭环;
- (2)面向生产运营优化的闭环;
- (3)面向企业协同、用户交互与产品服务优化的闭环。
工业互联网的基础
工业互联网平台包括边、端、云三个部分,“云”是传统云计算的中心节点,云端数据中心;“边”是云计算的边缘侧,分为基础设施边缘和设备边缘;“端”是终端设备,如手机、智能化电气设备、各类传感器、摄像头等。它通常采用云计算和边缘计算技术构建,工业互联网平台构造使用的主要技术包括虚拟化技术、分布式数据存储技术、编程模式、大规模数据管理、分布式资源管理、信息安全、平台管理等。
云边协同
边缘计算(Edge Computing)是一种分布式计算,是指将计算任务下放至接近数据源的设备。
我们以简单的云边协同场景举例:现实中的设备会产生大量数据,全部上传至云平台会对云造成巨大压力,为了分担中心云的压力,在各个靠近设备的节点应用边缘计算,各节点需要负责自己范围内的数据计算和储存工作,之后数据再上传汇聚到中心云,用来做大数据分析挖掘,数据共享,同时完成算法模型的训练和升级。升级之后的算法会推送到前段更新设备,完成自主学习的闭环,同时,如果边缘节点出现故障,中心云处理的数据也不会丢失。
这样“就近计算”降低了时延、提高了稳定性,与云端数据中心网络连接故障时,可用MEC本地临时服务,从而提升了用户体验;同时,也节省了带宽(减轻网络负担)、节省数据中心的能耗、减少数据中心的存储需求。
但这并不是说就此摆脱了云端数据中心。边缘服务器分布广泛,无法做到全局的通信和调度,而且也没有云端的计算能力。实际上,云和边是彼此配合的,也就是“云边协同”。一个生动的例子可类比云与边的关系——章鱼。它的神经元40%分布在脑部(云),60%分布在触手(边)上,这种一个大脑+多个小脑的结构与云+边的分布式架构相似。
各种终端设备将数据传输到边缘服务器,边缘服务器对数据进行处理(如数据清理、检测、模型实时推断等),再传输到云平台进行复杂、全局性的处理任务。边缘与中心配合行动,实现算力优化、效率提升。
工业互联网的关键技术
工业互联网技术体系包括4个部分:
- 全面互联的工业系统信息感知技术。
-
- 设备接入:对海量设备进行连接和管理;
- 协议解析:利用协议转换实现海量工业数据的互联互通和互操作;
- 边缘数据处理:通过运用边缘计算技术,实现错误数据剔除、数据缓存等预处理以及边缘实时分析,降低网络传输负载和云端计算压力。
-
- 信息传输技术。传输层主要负责传递和处理感知层获取的信息,分为有线传输和无线传输两大类,其中无线传输是物联网的主要应用。无线传输技术按传输距离可划分为两类:
-
- 以Zigbee、WiFi、蓝牙等为代表的短距离传输技术,即局域网通信技术;
- LPWAN(低功耗广域网),即广域网通信技术。
-
- 数据分析平台。工业互联网平台需要借助大数据分析技术、人工智能方法等,基于专家经验,结合物理、数学等基础学科知识,从工业大数据中获得有价值的经验。
- 工业APP开发技术。工业 APP 的构建是工业互联网平台协作模式转换的核心,通过对工业知识的提炼与抽象,将数据模型、提炼与抽象的知识结果通过形式化封装与固化形成 APP。封装了工业知识的工业 APP,对人和机器快速高效赋能,突破了知识应用对人脑和人体所在时空的限制,最终直接驱动工业设备及工业业务。
六、区块链
区块链(blockchain)是一种块链式存储、不可篡改、安全可信的去中心化分布式账本,它结合了分布式存储、点对点传输、共识机制、密码学等技术,通过不断增长的数据块链(Blocks)记录交易和信息,确保数据的安全和透明性。
区块链起源于比特币(Bitcoin),最初由中本聪(Satoshi Nakamoto)在2008年提出,作为比特币的底层技术。从诞生初期的比特币网络开始,区块链逐渐演化为一项全球性技术,吸引了全球的关注和投资。随后,以太坊(Ethereum)等新一代区块链平台的出现进一步扩展了应用领域。
区块链的特点包括去中心化、不可篡改、透明、安全和可编程性。每个数据块都链接到前一个块,形成连续的链,保障了交易历史的完整性。智能合约技术使区块链可编程,支持更广泛的应用。
区块链在金融、供应链、医疗、不动产等领域得到广泛应用。尽管仍面临可扩展性和法规挑战,但它已经成为改变传统商业和社会模式的强大工具,对未来具有巨大潜力。
区块链包括三个基本要素:
-
- 交易(Transaction,一次操作,导致账本状态的一次改变)
- 区块(Block,记录一段时间内发生的交易和状态结果,是对当前账本状态的一次共识)
- 链(Chain,由一个个区块按照发生顺序串联而成,是整个状态变化的日志记录)
区块链中每个区块保存规定时间段内的数据记录(即交易),并通过密码学的方式构建一条安全可信的链条,形成一个不可篡改、全员共有的分布式账本。通俗地说,区块链是一个收录所有历史交易的账本,不同节点之间各持一份,节点间通过共识算法确保所有人的账本最终趋于一致。区块链中的每一个区块就是账本的每一页,记录了一个批次记录下来的交易条目。这样一来,所有交易的细节都被记录在一个任何节点都可以看得到的公开账本上,如果想要修改一个已经记录的交易,需要所有持有账本的节点同时修改。
同时,由于区块链账本里面的每一页都记录了上一页的一个摘要信息,如果修改了某一页的账本(也就是篡改了某一个区块),其摘要就会跟下一页上记录的摘要不匹配,这时候就要连带修改下一页的内容,这就进一步导致了下一页的摘要与下下页的记录不匹配。如此循环,一个交易的篡改会导致后续所有区块摘要的修改,考虑到还要让所有人承认这些改变,这将是一个工作量巨大到近乎不可能完成的工作。正是从这个角度看,区块链具有不可篡改的特性。
区块链技术的应用场景
通俗的说,区块链技术可以在无需第三方背书情况下实现系统中所有数据信息的公开透明、不可篡改、不可伪造、可追溯。区块链作为一种底层协议或技术方案可以有效地解决信任问题,实现价值的自由传递,在数字货币、金融资产的交易结算、数字政务、存证防伪数据服务等领域具有广阔前景。