登录
主页
 文章
Google BigQuery 是 Google 推出的一项全代管式、可扩展性强且成本低廉的无服务器企业数据仓库服务。一、特点和优势- 无服务器:无需管理基础架构,用户可以专注于分析数据,使用熟悉的 SQL 发掘有价值的数据洞见,而无需指派数据库管理员。- 实时分析:其高速流式数据插入 API 为实时分析提供了强大基础,可让最新业务数据立即用于分析,以便了解正在发生的情况。
1077
8
8
Apache Hive 是一个基于 Hadoop 的强大数据仓库解决方案,2007-2008 年:Hive 诞生于 Facebook,并被开源贡献给 Apache 软件基金会。2010 年:Hive 正式获得 Apache 顶级项目的地位。2019 年:Hive 3.0 版本发布,进一步优化了性能和安全性,引入了 ACID(原子性、一致性、隔离性、持久性)事务支持以及更好的动态分区支持。
1190
9
9
Snowflake 是一种云数据仓库,它在云平台上提供了快速、灵活且易于使用的解决方案,用于存储和分析大规模的结构化和半结构化数据。Snowflake 于 2014 年公开推出,并在 2020 年 9 月正式上市,是迄今为止最大的软件 IPO 上市公司。db-engines 追踪了 snowflake 自 2016 年 7 月以来的流行度分数,其初始流行度分数是 0.35 分,在 2020 年 8 月增加到 2.59 分,2022 年 1 月的得分是 76.82 分,在 2021 年期间增加了 61.29 分。在 db-engines 的整体排名中,snowflake 在 2021 年开始时排名 37,过去 12 个月中已经攀升了 20 位,排名 17,而且这一趋势似乎还没有结束。
1116
2
9
Vertica 是一款基于列存储的大规模并行处理(MPP)架构的数据库。它由关系数据库大师 Michael Stonebraker(2014 年图灵奖获得者)创建,于 2011 年被惠普收购,成为其核心大数据平台软件。一、特点和优势- 支持大规模结构化数据:可以存放多至 PB 级别的数据。- 列式存储和计算:通过列式计算和强大的主动数据压缩,大幅降低成本高昂的磁盘 I/O,执行查询的速度可提升 50 到 1000 倍,存储成本最高削减 90%。
1157
2
4
Cassandra 是一个开源的、分布式、去中心化的数据库系统,具有高度可扩展性和高可用性,旨在处理分布在多台服务器上的大量结构化数据,且没有单点故障。在发展过程中,cassandra 不断完善和优化其功能,逐渐成为流行的 NoSQL 宽表数据库之一,被广泛应用于大规模数据存储、高并发读写等场景。它从 Google 的 Bigtable 中吸取了 LSM 单机引擎的精华,又学习了 Amazon Dynamo 做分布式、管理集群和灾难容错等方面的经验。得益于 Facebook 将其开源的决策以及社区的持续优化,cassandra 在 NoSQL 宽表领域占据了重要地位。
1113
9
14
DynamoDB 是亚马逊公司推出的一款完全托管的 NoSQL 对数据库服务。DynamoDB 开创了云原生 NoSQL 数据库领域,具有大规模高性能、无需管理服务器、适合大型企业、全局表等特性,能够在 PB 级规模下实现个位数毫秒延迟,并为普通表提供99.99%的可用性 SLA,为全局表(跨多个 AWS Region 进行跨表复制)提供99.999%的可用性 SLA。它作为键/值和文档数据库,可以在任何规模的环境中提供个位数的毫秒级性能,是一个完全托管、多区域、多活的持久数据库,具有适用于互联网规模应用程序的内置安全性、备份和恢复以及内存缓存等功能。
632
3
14
MPP 数据库(Greenplum)是业界具有较高性能和性价比的关系型分布式数据库。它在开源的 PostgreSQL 基础上采用 MPP(大规模并行处理)架构,具有强大的大规模数据分析任务处理能力。一、主要特点1. 完善的标准:支持 ANSI SQL 2008 和 SQL OLAP 2003 扩展,以及 ODBC 和 JDBC 应用编程接口,方便系统开发、维护和管理。
1030
2
2
大规模并行处理数据库StarRocks是新一代极速全场景 MPP(大规模并行处理)数据库。它充分吸收关系型 OLAP 数据库和分布式存储系统在大数据时代的优秀研究成果,在业界实践的基础上,进一步改进优化、升级架构,并增添了众多全新功能,形成了全新的企业级产品。自 2021 年 9 月正式开源。从 3.0 版本起正式支持存算分离架构,用户的存储成本能下降 80%,计算节点因无状态,可通过快速弹性、跨可用区部署等方式提高计算的可用性,并且计算资源能够进行物理隔离,按需独立弹性伸缩。在数据湖分析性能上,它不仅能够直接分析外部数据源,免除 ETL(提取、转换清洗、加载)的负担,还对开放数据湖的数据进行了大量优化,进一步提升查询效率。在物化视图方面,能够简化数据分层建模,实现透明加速查询,使对各种数据表的预先建模演变为后建模,让分析师得以创建可满足业务需求的逻辑视图。
859
7
5
ClickHouse数据库 是一款高性能的列式数据库管理系统,具有出色的数据分析和处理能力。ClickHouse 最早由俄罗斯 IT 公司 Yandex 为 Yandex.Metrica 网络分析服务开发。经过多年的发展,ClickHouse 的开发者和用户已经遍布全球各地。许多头部大厂都在深度使用 ClickHouse 技术,适用于大数据分析、日志分析、数据仓库、实时分析、时序数据分析、数据统计和报表等多种场景。
625
9
1
标杆分析法(Benchmarking Analysis Method)是一种将企业自身的产品、服务、流程等与同行业内或其他行业的优秀企业进行比较和衡量,以识别自身的优势和不足,并寻求改进和优化机会的管理方法。它的基本原理是通过对最佳实践的研究和学习,借鉴他人的成功经验,从而提高自身的绩效和竞争力。
774
2
2
风险分析法(Risk Analysis Method )是一种用于评估和量化潜在风险的方法,它可以帮助个人或组织识别、评估和优先处理风险。风险分析法的发展有着较为漫长的历史,其起源可以追溯到多个领域的早期实践和理论探索。在古代,人们在进行商业交易、农业生产和航海等活动时,已经开始意识到不确定性和潜在的风险,并尝试通过一些简单的经验和直觉来进行判断和应对。然而,这些早期的尝试还缺乏系统的方法和理论支持。
1052
2
14
关键路径分析法(Critical Path Analysis,CPA)是一种项目管理工具,用于确定项目中的关键任务和关键路径。这种方法基于网络图,通过分析项目任务之间的依赖关系来确定完成项目所需的最短时间。关键路径是项目中一系列连续的任务,它们决定了项目的总持续时间,任何延误都可能导致整个项目的延期。
719
6
6
PEST分析是一种常用的战略外部环境分析工具,主要用于评估影响企业或组织的宏观环境因素。PEST 分析方法最早由哈佛经济学教授弗朗西斯·阿吉拉尔(Francis J. Aguilar)于 1967 年提出,是用于判断外部宏观环境的一种理论框架。PEST分析有助于企业从不同角度全面了解外部环境,评估这些宏观因素对企业战略目标和战略制定的影响 。此外,PEST分析还可以扩展为PESTEL或STEEPLE分析,增加环境(Environmental)、法律(Legal)和道德(Ethical)等因素,以提供更全面的视角 。
503
4
2
SWOT分析法是一种战略规划工具,用于评估一个组织、项目或个人的优势(Strengths)、劣势(Weaknesses)、机会(Opportunities)和威胁(Threats)。SWOT分析法最初由哈佛商学院的肯尼斯·安德鲁斯(Kenneth R. Andrews)教授在1971年的《公司战略论》一书中提出,用于企业战略规划。目前常与其他分析工具如PEST分析和波特五力模型等结合使用,以提供更全面的视角。
962
7
8
系统方程分析(System Equation Analysis)是一种数学和工程学方法,用于研究和理解复杂系统的行为。这种分析通常涉及构建和求解描述系统状态和随时间变化的方程。系统可以是物理的、化学的、生物的、经济的或任何其他类型的,只要它们的行为可以用数学模型来描述。一、关键组成部分
967
4
0
对应分析(Correspondence Analysis,CA)是一种多维统计分析方法,主要用于分析名义尺度或序数尺度的分类数据。它是一种探索性数据分析技术,用于揭示分类变量之间的关系,以及它们如何相互关联。对应分析通常用于市场研究、社会科学、生物学等领域。对应分析的基本思想是将列联表(一个包含两个或多个分类变量的表格)中的行和列转换为点,这些点在低维空间(通常是二维或三维)中表示,以便于可视化和解释。通过这种方式,对应分析可以揭示变量之间的内在结构和关系。
898
6
11
Neo4j 是一个高性能的 NoSQL 图形数据库。它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。它使用图形模型来表示数据,使得数据之间的关系直观且易于查询。一、基本概念1. 图形数据结构:包含两种基本的数据类型,即 nodes(节点)和 relationships(关系)。节点用于表示实体,节点和关系都可以包含 key/value 形式的属性。节点通过关系相连,形成关系型网络结构。关系具有方向性,同时一个节点可以有指向自己的关系。
989
8
3
OrientDB 是一种多模型数据库管理系统(DBMS),它结合了文档和图形引擎的优势,提供了强大的数据存储和查询能力。它支持文档、图形、对象和键值等多种数据模型,适用于处理各种复杂的数据关系和应用场景。OrientDB 还提供了图形界面 OrientDB Studio,支持通过 GUI 进行数据库操作,如执行查询、编辑顶点、管理架构等。同时,OrientDB 支持多种编程语言的 API 和驱动程序,如 Java、Python 等,便于开发者将 OrientDB 集成到项目中。
1006
1
8
ArangoDB是一款原生多模型数据库,它支持文档、键/值对以及图形这三种数据模型,使用统一的内核和声明式查询语言AQL来处理不同模型的数据,允许在单次查询中混合使用多种模型,无需在不同模型间进行切换或数据传输,从而在性能上具有优势。ArangoDB的发展历史可以追溯到其原生的多模型特性,这种设计允许它支持文档、图形和键值数据模型。ArangoDB的多模型支持使其在处理不同类型的数据和应用场景时具有极大的灵活性,例如,它能够使用统一的内核和声明式查询语言AQL来处理不同模型的数据,允许在单次查询中混合使用多种模型,无需在不同模型间进行切换或数据传输,从而在性能上具有优势。
1001
7
12
JanusGraph是一个开源的、分布式的图形数据库,专为存储和查询大规模图数据而设计。它支持数千亿个顶点和边的存储,分布在多机集群中,能够处理高度连接的数据 。JanusGraph由Apache TinkerPop社区开发,支持Apache Cassandra和Apache HBase作为存储后端,并提供对Gremlin图遍历语言的原生支持 。JanusGraph的起源是Twitter的backendDB,后更名为JanusGraph,并成为Linux Software Foundation下的一个项目。它旨在通过增加新功能、改善性能和扩展性来增强分布式图系统的功能 。JanusGraph支持多种后端存储系统,包括但不限于Apache Cassandra、Apache HBase、Google Cloud Bigtable和Oracle BerkeleyDB 。此外,它还支持与大数据平台如Apache Spark、Apache Giraph、Apache Hadoop等集成,以提供全球图数据分析和报表功能 。
671
8
8
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 (深数据® DEEPDATA® 极深®) 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号