蓝盟弱电工程,物联网环境的开源数据库是什么?

发布者:上海IT外包 发布时间:2019/4/3 10:00:30来源:www.linemore.com

 根据Gartner的报告,预计未来五年物联网设备的数量将达到数十亿。物联网提出了一个非常新颖的挑战,特别是对于数据库管理系统,例如如何实时集成大量数据和管理数据安全性。例如,基于智能城市中应用的物联网的交通传感器将实时生成大量的交通数据。数据库在完整处理物联网数据方面起着非常重要的作用。因此,使用合适的平台,正确的数据库同样重要。由于物联网在全球多样化的环境中运行,因此选择正确的数据库变得非常困难。另一个例子是基于安装在智能城市中的物联网的环境温度传感器,其在几分钟内产生大量关于活动的大气温度和湿度的数据。
  您可以看到物联网的一个重要特征是以数据为中心:
  块
  假设有一个传感器网络100度的传感器,并且每个传感器节点只返回1 KB每分钟的数据,然后将每天的数据量达到1.4 GB。如果是敏感的传感器的一个大的网络,该量每天的数据可以达到1 TB以上。至于物联网中物联网的未来,产生的数据量非常大。因此,物联网数据非常庞大。
  多态性
  物联网的应用涵盖了一切,产生的数据自然是多样的。存在诸如温度和湿度的环境数据,诸如视频和音频的多媒体数据,以及用于与用户交换信息的结构化数据。数据的多态性不可避免地增加了数据的复杂性。由不同网络生成的数据格式可以是不同的。即使是相同类型的数据也会具有单位差异和精度。测量数量也会在不同时间发生变化。因此,互联网数据的东西是多态的。
  3.相关性和语义学。
  物联网上的数据不会相互独立。描述相同实体的数据在时间上相关,描述不同实体的数据在空间上相关,描述实体的不同维度也是相关的。关联的不同关联产生丰富的语义,并且可以从时间,空间或维度中的数据关联推断出实体中的变化。
  总之,在许多物联网系统中,有必要监视大量网络设备,并通过监视采样的数据持续存在。经过分析,不难看出物联网上的数据类型是:
  RFID:射频识别
  地址/唯一标识符
  流程,系统和对象的描述性数据。
  通用环境和位置数据。
  传感器数据:多维时间序列数据
  历史数据
  物理模型:模型是一个现实的模板。
  用于控制的执行器状态和命令数据。
  因此,在为物联网应用选择数据库之前我们必须考虑的因素是:规模,规模和指数。
  处理大量数据时的有效性。
  易于使用的模式
  可移植性
  查询语言
  流程建模和交易。
  异质性和整合。
  聚合时间序列
  档案
  安全和成本
  以下是对大数据时代使用的当前数据库特征的简单分析。
  数据库在大数据时代。
  在此比较表中很容易看出,这些基于存储的数据库各有优缺点。 Hbase属于NO SQL。虽然它适用于高并发查询,但它与SQL查询不直接兼容。 HIVE数据库更适合批处理。数据,在线交易处理(OLTP)是不可能的; MYSQL属于传统的RDS,其系统可扩展性差,不适合大规模海量数据处理; Redis是一个内存数据库系统,它基于内存计算,系统可扩展性和安全性差。
  那么,什么样的数据适合物联网?
  事实上,多年前,工业领域有一个特殊的数据库来执行这项任务。在工业领域,这被称为实时数据库。工业领域的实时数据库具有主要功能,如数据采集,实时缓冲,数据重写(向设备发送指令)和采样数据文件。
  目前,工业领域的实时数据库基本上被外国制造商垄断并且价格昂贵。例如,PI(工厂信息系统)是基于由美国OSIsoft开发的客户端/服务器结构的商业软件应用平台。它充当工厂的底层控制网络和上层管理信息系统网络之间的桥梁。 PI是植物信息的整合。发挥特殊而重要的作用。 PI数据库的基本版本(仅5,000点)将花费大约100,000美元,每个数据收集界面将花费6,000美元。对于新兴的物联网公司来说,这个价格太贵了。
  以下重点介绍了几个物联网的开源数据库:
  InfluxDB
  开源URL:https://github.com/influxdata/influxdb
  数据库在大数据时代。
  InfluxDB于2013年首次推出,是最新的数据库之一。编程语言Go用于开发此数据库,该数据库完全基于关键值数据库LevelDB。 InfluxDB是一个时间序列数据库,用于优化和处理时间序列数据。 2000年,Kdb首次发布时间序列数据,但随着物联网的兴起,InfluxDB开始流行,因为它推广了NoSQL,NewSQL和大量日益庞大的数据。
  将InfluxDB用于物联网数据的优势包括:允许索引
  它有一个SQL类型的查询语言
  它还提供缺失数据的内置线性插值
  它支持自动数据缩减。
  支持连续查询以计算聚合。
  2. CrateDB
  开源URL:https://github.com/crate/crate
  CrateDB是一个分布式SQL数据库管理系统。作为用Java编写的开源代码,它包含来自Facebook Presto,Apache Lucene,Elasticsearch和Netty的组件,因此它具有高度可扩展性。开发CrateDB是为了使物联网数据正常工作。 CrateDB是物联网解决方案的新创新者选择的数据库,从工业互联网和联网汽车到便携式设备。
  将CrateDB用于物联网数据的优势包括:
  每秒数百万个数据点:快速和线性可扩展的数据捕获
  实时查询:列和字段高速缓存中的索引在内存中提供SQL性能
  动态模式:添加并立即查询新的传感器数据结构
  物联网分析:快速而强大的时间序列,IA,地理空间,文本搜索,连接,聚合
  始终开启:内置数据复制和群集重新平衡,以确保不间断的性能
  ANSI SQL:任何开发人员都不需要阻止使用和集成
  内置MQTT代理:直接设备到数据库集成
  物联网生态系统:适用于Kafka,Grafana,NodeRED和其他流行的物联网堆叠程序
  在任何地方运行以在边缘或云中高效处理
  3. RethinkDB
  开源URL:https://github.com/rethinkdb/rethinkdb
  在开源数据库列表中,RethinkDB位于顶部。它是一个可从Web实时扩展的JSON数据库,从头开始构建。 RethinkDB通过转换传统的数据库架构来呈现令人兴奋的新访问模型。当开发人员向您发送命令时,您可以不断将更新的查询结果发送给应用程序。这就是开发人员称之为换卡器的原因。 RethinkDB充当系统状态的数据库,实时存储库和消息代理,允许更改过程。其实时推送架构大大减少了实时创建可扩展应用程序所需的时间和精力。
  将RethinkDB用于物联网传感器数据的优势包括:
  RethinkDB有一种用于验证API的查询语言,它非常易于配置和学习。
  如果主服务器出现故障,该命令将自动转移到新服务器。实时即插即用节点功能,无需停机一秒,有助于轻松添加节点。
  通过Ruby和Tornado中的Eventmachine提供异步查询,提供异步应用程序编程接口。
  它仅提供SSL访问,以通过公共Internet安全地访问RethinkDB。
  Floor,Ceil和Round是RethinkDB提供的几个数学运算符。
  4. Apache Cassandra
  开源网址:
  http://cassandra.apache.org/,
  https://github.com/apache/cassandra
  阿帕奇Cassandra是一个管理系统的NoSQL分布式数据库和开源的,最初在2008年发布。这是设计来处理大量在许多商用服务器的数据,提供与不存在单一故障点的高可用性。
  在物联网中,由于连接设备数量众多,因此跨多个网络跟踪和共享数据的规模非常大。 Cassandra非常擅长直接使用存在于不同地理位置的设备,用户,传感器和类似机制的大量时间序列数据。

 

上海IT外包服务网 链接:http://www.linemore.com

>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部