物联网是一个非常广泛的概念,它意味着各种设备和机器通过互联网连接,车辆互联网和工业互联网都在物联网上。根据Gartner的报告,2019年连接设备已超过142亿,预计到2021年将达到250亿。这是一个巨大的数字。毫无疑问,我们需要一个物联网大数据平台来处理这些连接设备产生的大量数据。
物联网大数据平台的功能和特点
物联网大数据平台应具备哪些功能?与一般大数据平台相比,您需要具备哪些功能?让我们仔细看看。
高效分配
它必须是一个高效的分布式系统。物联网产生的数据量巨大。仅在中国,就有超过5亿台智能电表。每个仪表每15分钟收集一次数据。有一天,全国智能电表将产生超过500亿条记录。如此大量的数据,没有服务器可以处理它们,因此处理系统必须水平分布和扩展。为了降低成本,节点的吞吐量必须高效,这需要快速写入和快速查询以支持数据。
2.实时处理
它必须是实时处理的系统。互联网大数据处理,家庭场景是用户肖像,推荐系统,舆论分析等。这些方案不需要实时批处理。但是,对于物联网场景,需要基于所收集数据的实时警告和决策,并且必须在几秒钟内控制延迟。如果计算不是实时的,那么物联网的商业价值就会大大降低。
3.高可靠性
需要在操作员级别提供高度可靠的服务。物联网(IoT)系统经常连接到生产和运营系统。如果数据处理系统闲置,将直接导致生产暂停,这将造成经济损失,这将导致最终消费者缺乏正常服务。例如,智能电表,如果系统出现问题,这直接导致数千家庭无法使用电力。因此,互联网大数据系统的东西必须高度可靠。它必须与实时数据备份兼容。它必须与远程灾难恢复兼容。它必须与在线软件和硬件更新兼容。它必须与IDC会议室的在线迁移兼容。否则,服务可能会中断。
4.高效的缓存
您需要高效的缓存。在大多数情况下,您应该能够快速获取警报,大屏幕或其他设备的当前状态或其他设备信息。系统必须为用户提供有效的机制,以获取满足过滤条件的所有或部分设备的最新状态。
5.实时传输的计算
需要实时传输计算。几个实时警告或预测不仅仅基于某个阈值,而且必须在由一个或多个设备生成的数据序列中执行实时聚合计算,不仅基于某个时间点,而且也在时间窗口。不仅如此,计算要求也非常复杂,具体取决于场景,用户定义的函数应该能够执行计算。6.数据订阅
您需要支持数据订阅。根据一般的大数据平台,许多应用程序需要相同的数据集,因此系统必须提供订阅功能,每当有新的数据更新时,必须实时记住应用程序。此订阅也必须自定义,允许应用程序建立过滤器,例如仅订阅五分钟的物理平均值。
7.结合历史数据的处理。
必须将实时数据处理和历史数据合并为一个。实时数据在缓存中,历史数据在永久存储介质中,并且可以根据时间段保留在不同的存储介质中。系统必须隐藏其后面的存储,为用户和应用程序提供相同的界面和界面。无论您是否可以访问十年前新获取的数据或旧数据,其余部分应该相同,但输入时间参数除外。
8.数据继续稳定编写
有必要确保数据可以继续稳定地写入。对于物联网系统,数据流量通常是稳定的,因此数据写入所需的资源通常很大。但这种变化是协商,分析,特别是临时协商,这可能会花费很多系统资源而且无法控制。因此,系统必须确保分配足够的资源以确保可以将数据写入系统而不会丢失数据。确切地说,系统必须首先是书写系统。
9.多维数据分析。
需要灵活分析多维数据。对于联网设备生成的数据,需要对多个维度进行统计分析,例如从设备的地理位置进行分析,从设备模型分析,由提供商进行分析,由设备使用的人员进行分析等等另外,这些尺寸的分析不能事先考虑,而是根据业务发展的需要在实际操作过程中确定。因此,互联网大数据系统需要一种灵活的机制来增加对给定维度的分析。
10.支持数据的计算
您需要支持低频数据,插值,特殊功能的计算和其他操作。原始数据的收集可能非常高,但在具体分析中,通常不需要执行原始收据,但在数据被拒绝后。系统需要提供有效的向下数据转换操作。这些设备很难同步。很难对齐不同设备的数据收集时间。因此,分析特定时间点的值通常需要插值来解决问题。系统必须提供多种插值策略,如线性插值和固定值。 OK在工业互联网上,除了一般统计操作外,通常还需要承认一些特殊功能,例如时间加权平均值。
11.分析和临时磋商
需要承认临时分析和咨询。为了提高大数据分析师的工作效率,系统必须提供命令行工具或允许用户通过其他工具执行SQL查询,而不必通过编程接口。查询分析的结果可以轻松导出,然后成为几个图标。12.灵活的数据管理战略。
需要提供灵活的数据管理策略。大型系统收集各种各样的数据,除了收集的原始数据外,还有大量的派生数据。这些数据中的每一个都具有不同的特征,其中一些具有高采集频率,一些需要延长的保留时间,一些需要多个副本以确保更高的安全性,一些需要能够快速访问。因此,物联网大数据平台必须提供多种策略,允许用户根据特点进行选择和配置,并将几种策略并存。
13.开放系统
它必须是开放的系统必须支持行业标准的SQL,提供各种语言开发接口,包括C/C ++,Java,Go,Python,RESTful等,它还必须支持Spark,R,Matlab等。为了便于整合各种机器学习,手动,智能算法或其他应用程序,大型数据处理平台可以扩展而不会变成孤岛。
14.支持异构环境
系统必须支持异构环境。大数据平台的建设是一项长期工作。每批购买的服务器和存储设备将有所不同。系统必须支持不同程度,不同配置的服务器和存储设备。
15.侧面云中的协作支持
需要支持侧面云中的协作。必须有一种灵活的机制来将数据从外围计算节点加载到云。根据具体需要,原始数据或已处理数据,或仅满足过滤条件的数据可以与云同步,并且可以随时取消。
16.单一基金管理
需要一个后台管理系统。方便查看系统运行状态,管理集群,管理用户,管理各种系统资源等,系统可与第三方IT运维监控平台无缝集成,便于管理。
17.部署私有化
实施容易私有化。因为许多公司都希望采用私有化部署安全性和几个因素。传统公司通常没有可靠的IT运营和维护团队,因此在安装和实施时必须简单,快速和可维护。
以上总结了物联网大数据平台的主要功能和特点。虽然物联网大数据平台本身在不断发展,但总体目标不会改变,即高效,可扩展,实时,可靠,灵活,开放,简单且易于维护。