登录
主页
 文章
Clonezilla是一个开源的系统克隆工具,它可以对整个系统或单个分区进行克隆。由台湾的NCHC自由软件实验室开发。Clonezilla Live:适用于单台计算机,可以将存储介质或单个分区镜像到多种类型的存储位置,包括SSH服务器、Samba网络共享等。它还支持直接将一个存储介质上的数据克隆到另一个存储介质上。
680
9
1
TimeShift是Linux 系统备份程序,类似于 Windows 中的系统还原和 macOS 中的 Time Machine,通过定期获取文件系统的增量快照,可将系统恢复到以前的状态,提供 rsync 模式和 btrfs 模式。Timeshift 允许用户创建系统快照,以便在出现问题时能够恢复到之前的状态。Timeshift 支持使用 Rsync 或 BTRFS 两种方式来创建快照,提供了类似于 Windows 系统中的系统还原功能和 macOS 中的时间机器工具。
996
6
2
Apache InLong(应龙):一站式的海量数据集成框架,提供自动、安全、可靠和高性能的数据传输能力,方便业务构建基于流式的数据分析、建模和应用。InLong 能够方便业务快速构建基于流式的数据分析、建模和应用,广泛应用于广告、支付、社交、游戏、人工智能等各个行业领域。InLong 项目最初由腾讯大数据团队捐献到 Apache 孵化器,并于 2022 年 6 月正式毕业成为 Apache 顶级项目。目前,InLong 正服务于上千个业务,其中高性能场景数据规模超百万亿条/天,高可靠场景数据规模超十万亿条/天。
877
2
12
Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和数据分发系统。基于 web 图形界面,通过拖拽、连接、配置完成基于流程的编程,实现数据采集等功能。一、主要特点1. 可视化编程 - NiFi 提供了一个基于 Web 的用户界面,用户可以通过拖放、连接不同的处理器来构建数据处理流程,无需编写复杂的代码,使得数据处理流程的设计和修改变得直观和便捷。
1149
3
2
Bup:基于 git packfile 格式,提供快速增量存储、全局重复数据删除,适用于 Linux、FreeBSD、NetBSD、macOS、Solaris 或 Windows(带有 Cygwin 和 WSL)等。一、主要特点1. 高效性 - 采用先进的算法,能够快速备份大量数据,节省时间和系统资源。无论是小文件还是大型数据集,都能迅速完成备份任务。
730
5
9
Apache SeaTunnel:分布式、高性能、易扩展的数据集成平台,架构于 Apache Spark 和 Apache Flink 之上,用于海量数据(离线&实时)同步和转化。前身是 waterdrop(中文名:水滴),2021 年 10 月 12 日更名为 SeaTunnel,2021 年 12 月 9 日正式成为 Apache 孵化器项目,2022 年 3 月 18 日社区发布首个 Apache 版本 v2.1.0 ,截至目前已发布了 39 个版本,并经过大量企业生产使用。
556
3
10
Addax:异构数据源离线同步工具,最初来源于阿里的 DataX,致力于实现包括关系型数据库、HDFS、Hive、HBase、FTP 等各种异构数据源之间稳定高效的数据同步功能。一、功能特性 - 并行处理:采用多线程并行处理策略,能根据数据源和目标的特性灵活分配任务,还可智能切分文件与表,实现数据读取与写入的最大化并发,从而提高数据迁移速度。
1085
3
6
BackInTime:易于使用的 GNU/Linux 文件和文件夹备份工具,提供命令行工具和 QT5 GUI,使用 rsync 手动或计划执行快照,并可通过 SSH 在本地或远程存储快照。一、主要特点- 多种备份方式:提供了命令行工具和基于Qt5的图形界面(Back In Time-qt),用户可以根据自己的需求和使用习惯选择适合的方式进行操作。
700
9
12
TIS:基于批量数据处理(DataX)和流式数据处理(Flink-CDC、Chunjun)一体,提供简单易用的操作界面,降低用户实施各端(MySQL、PostgreSQL、Oracle、Elasticsearch、ClickHouse、Doris 等)之间数据同步的实施门槛。一、功能特点1. 高效的数据同步 - 能够实时捕获数据源的变化,并将其快速同步到目标系统中。无论是批量数据的周期性同步,还是流式数据的即时传输,TIS 都能确保数据的准确性和及时性。
1140
8
4
- MinerU:一站式、开源、高质量的数据提取工具,支持多种功能,如提取 PDF、markdown 等格式的内容。一、特点1. 多源数据支持:可以从各种数据源中提取数据,包括数据库、文件系统、网页等。无论你是需要从企业内部的数据库中获取销售数据,还是从互联网上抓取特定信息,MinerU 都能胜任。
775
7
8
Griffin:是一个开源的大数据数据质量解决方案,支持批处理和流模式两种数据质量检测方式,可以从不同维度度量数据资产,从而提升数据的准确度、可信度。它的数据源可以是 Hadoop、RDBMS、Kafka 等,能够定义对数据的精确度、合法性、一致性、时间序列、完整性等进行检测,其检测任务运行在 Spark 基础上。
641
2
12
DataHub:是一个用于数据发现、元数据管理和数据治理的开源平台。它提供了一个集中式的元数据存储库,支持多种数据源和数据格式。DataHub 具有强大的搜索和浏览功能,使用户能够轻松发现和理解数据资产。此外,它还提供了数据 lineage(数据血缘)跟踪、数据质量监控和数据治理工作流等功能,帮助企业更好地管理和利用其数据资产。
691
8
3
Apache Atlas为具有数据密集型平台的公司提供基本的元数据管理和数据治理功能,主要为在 Hadoop 集群中使用而设计,但也可与 Hadoop 生态系统之外的工具和进程交换元数据以实现集成。它具有灵活的类型系统来定义和管理元数据对象的模型,能自动对数据资产和数据沿袭信息进行编目,并与 Apache Ranger 数据安全框架集成实现访问控制和数据屏蔽等功能。
961
5
11
Shield:专为保护关键基础设施数据而设计的先进数据保护解决方案,提供一套用于有效地调度存储系统自动备份的工具集,包括 PostgreSQL、MySQL、Consul、Redis 和 MongoDB 等,还支持在众多云提供商中存储备份。是一种用于数据保护和灾难恢复的重要技术解决方案。Shield是开源的。
827
8
11
Mermaid 是一个用于绘制流程图、时序图、甘特图等的开源工具。它使用类似 Markdown 的语法进行图表描述,可以在网页中直接使用,也可以通过命令行工具生成图像。Mermaid 支持与多种文档平台和代码托管平台集成,如 GitHub、GitLab 等。在项目文档编写、技术博客创作等场景中非常有用。例如,可以在项目的 README 文件中使用 Mermaid 绘制流程图来介绍项目的工作流程,或者在技术博客中使用 Mermaid 绘制时序图来解释复杂的交互过程。同时,由于它可以在网页中直接渲染,用户无需安装额外的软件即可查看图表,方便了知识的分享和传播。
968
9
13
PlantUML 是一个可以用简单的文本语言来描述 UML 图表(如类图、时序图、活动图等)的开源工具。它支持多种编程语言的代码嵌入,可以从代码中的注释生成图表,也可以直接在文本描述中引用代码片段。生成的图表可以以多种格式输出,如 PNG、SVG 等。在软件开发过程中,用于快速创建和共享软件设计的可视化表示。例如,开发团队可以使用 PlantUML 来描述系统的类结构、对象之间的交互流程等,方便团队成员之间的沟通和理解。同时,它也可以用于文档生成,将图表直接嵌入到技术文档中,提高文档的可读性和可理解性。
776
6
14
Bareos是高可靠、跨网络的开源备份软件,可用于基于网络备份、归档和恢复数据,支持多种客户端和存储,提供多种功能特性。一、功能特性 - 支持多种客户端和存储:客户端(“bareos-fd”)可用于 Linux、Windows、macOS、Solaris、HP-UX、AIX、BSD 等操作系统。能满足不同操作系统环境下的备份需求,适应多样化的企业 IT 架构。
1190
0
5
Graphviz 是一个用于绘制图表的开源软件包。它可以根据文本描述的图形结构自动生成图形,非常适合从代码生成各种类型的图表,如流程图、结构图等。可以使用特定的图形描述语言(如 DOT 语言)来描述图形,然后 Graphviz 工具会将其渲染为图像格式(如 PNG、SVG 等)。广泛应用于软件设计、数据库设计、网络架构等领域,帮助开发者可视化复杂的系统结构和流程。例如,在软件架构设计中,可以用 Graphviz 绘制模块之间的依赖关系图,以便更好地理解和沟通系统的整体结构。
693
7
11
BackupPC:支持 Linux、Windows 和 macOS 的开源企业级备份系统,提供易于管理的 web 界面,支持重复数据删除以提高存储效率,支持压缩对 CPU 的影响最小。BackupPC 最初是为 Linux 平台设计的备份工具,专注于为 Linux 系统提供高效的备份解决方案,能有效应对 Linux 系统多样的版本和复杂的环境,解决了 Linux 系统备份的难题。
508
1
7
DataEase 是一款人人可用的开源数据可视化分析工具。是目前国内比较火的开源数据可视化工具.2021年2月,DataEase 开源项目组成立。近几年DataEase 持续发展,在功能、性能、用户体验等方面不断优化和提升,社区用户不断增长,应用场景也日益广泛,在数据可视化领域的影响力逐渐扩大。其具体发展动态可能需要通过官方渠道、技术论坛、社交媒体等进一步了解。
730
3
7
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 (深数据® DEEPDATA® 极深®) 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号