登录
主页
 文章
KitOps是用于AI/ML项目的集中版本控制工具,通过可重用组件、集中版本管理和安全的ModelKit打包格式来简化ML工作流。它与Docker、Terraform和Kubernetes等工具无缝集成,支持多种云端存储,如AWS S3和Azure Blob,可在不增大Git仓库的情况下对大型数据集进行版本管理。项目地址:https://github.com/jozu-ai/kitops
1053
6
11
Supabase 是一个开源的后端即服务(Backend-as-a-Service, BaaS)平台,常被称为“开源版 Firebase”。它旨在为开发者提供快速搭建后端所需的核心工具,无需从零构建数据库、认证、存储等基础设施。Supabase 的核心目标是:“提供开源的 Firebase 替代方案”,让开发者通过简单的 API 即可使用企业级后端功能,同时保持数据控制权和开源自由。它强调“无供应商锁定”,支持自托管或使用其托管服务,数据存储在开源的 PostgreSQL 中,避免被单一平台绑定。
1063
9
4
AppFlowy 是一个开源的协作办公工具,定位为“开源版 Notion”,旨在为用户提供一个隐私优先、可自定义且本地优先的笔记与协作平台。它支持跨平台使用,包括桌面端(Windows、macOS、Linux)和移动端(iOS、Android),核心特点是开源免费、数据本地存储、高度可定制以及支持离线使用。
1002
2
1
国产开源对象存储系统RustFS在具备高性能、小体积、良好的兼容性等优势。其读写速度吊打同类工具 92% 以上,数据读写成功率达到 99.99%,二进制包仅 100MB,还全量支持 S3 协议,对 ARM 架构设备原生支持。项目地址:https://github.com/rustfs/rustfs一、技术原理1.Rust语言的底层支撑
733
3
9
n8n是一款开源的工作流自动化平台,它提供了一个低代码平台,允许用户通过拖放操作创建复杂的工作流,无需编写大量代码。n8n由Jan Oberhauser于2019年在德国柏林创建。n8n采用公平代码(Fair Code)许可证,支持本地部署或云端使用,数据可控性高,适合对隐私敏感的企业。可用于个人效率提升,如聚合信息、定时提醒等;也适用于企业自动化,如复杂业务流程整合、数据备份与监控等;还能作为开发者工具,通过自定义代码扩展节点,快速对接内部API。用户可在n8n中创建复杂工作流,连接多个应用和数据源,实现任务自动化执行,如自动收集数据、整理成报告并发送,同时在通讯工具中发送通知。提供超过400种预制节点,支持与各种应用和服务集成,包括CRM、数据库、社交媒体平台、邮件服务等,还能对接各种第三方API。
724
6
1
CSGHub是一个开源大模型管理平台,提供高效管理大模型及其数据集、空间和代码等资产的方法,可简化大型语言模型的管理和部署,用户可根据自身需求进行定制。CSGHub由OpenCSG团队开发的开源、可信的大模型资产管理平台。为用户提供一个开源开放的、针对大模型原生设计的资产管理平台,支持私有化部署和离线运行,帮助用户治理LLM和LLM应用生命周期中涉及到的资产,如数据集、模型文件、代码等。
911
3
14
GraphRAG利用 LLM 的功能从非结构化文本中提取有意义的结构化数据,利用知识图谱记忆结构来增强 LLM 的输出,已被证明可以显著提高 LLM 在事实准确性和关系推理方面的性能。将输入文本分割为多个可分析单元TextUnits,使用LLM提取实体、关系和关键声明,然后通过层次聚类技术对图谱进行社区划分,并生成每个社区的摘要。
510
1
7
智能体强化训练器(Agent Reinforcement Trainer,ART),使用GRPO算法训练多步骤智能体完成现实任务,支持Qwen2.5、Qwen3、Llama、Kimi等模型的强化学习训练。ART用在提高大型语言模型(LLM)在智能体工作流程中的性能,它允许开发者在现有的代码库中执行智能体运行,并将强化学习训练循环的复杂性卸载到ART后端。该平台使用GRPO算法训练多步骤智能体完成现实任务,支持Qwen2.5、Qwen3、Llama、Kimi等模型的强化学习训练。通过允许LLM从经验中学习,ART能够提高智能体的可靠性,适用于多种场景下智能体的强化训练。
838
9
2
Kaa IoT Platform是一个开源的、跨平台的物联网应用框架,为开发者提供了一套完整的工具集,用于构建和管理各种规模的IoT解决方案。通过提供服务器和SDK组件,可实现对连接对象和后端基础设施的数据管理,能管理无限数量的设备,支持收集和分析传感器数据、分析用户行为等功能。
533
1
5
Graphiti是一个用于构建和查询时间感知知识图谱的开源框架。它专为在动态环境中运行的AI智能体设计,能够持续整合用户交互、结构化与非结构化企业数据以及外部信息,形成一个连贯且可查询的图谱。项目地址:https://github.com/getzep/graphiti一、技术原理Graphiti的技术原理围绕动态知识图谱构建与时间感知能力展开,核心设计包括以下关键机制:
718
5
14
蓝牙OTA(Over-the-Air)是一种通过蓝牙无线通信技术实现设备固件(Firmware)远程升级的技术。它允许厂商或用户通过蓝牙连接,无需物理接口(如USB线)即可为蓝牙设备推送固件更新,从而修复漏洞、优化性能或新增功能。随着物联网(IoT)设备的普及,蓝牙OTA已成为智能硬件维护和迭代的核心技术之一。
609
8
10
mindsdb是一个用于构建AI系统的平台,能够对大规模联邦数据进行智能问答,提供了唯一需要的MCP(Model-Controller-Predictor)服务端解决方案。2017年,MindsDB由Adam Carrigan和Jorge Torres联合创立,总部位于美国旧金山。两人此前曾创办Real Life Analytics,致力于用AI技术实现广告精准投放,但以失败告终。之后,他们怀揣着“AI普惠”的理念,创立了MindsDB,旨在简化AI的上手难度,让普通软件开发者也能方便使用AI能力。
962
3
9
BentoML 是一个开源的机器学习模型部署与生命周期管理框架,旨在解决机器学习模型从训练完成到生产环境部署的全流程痛点,支持多种模型格式、部署场景和协作模式。其核心目标是让数据科学家和工程师能够快速、可靠地将模型转化为可生产的服务,同时简化模型版本管理、 scaling 和监控等运维工作。
937
3
1
Deep & Cross Network(DCN)是谷歌和斯坦福大学在2017年提出的,用于广告点击预测(Ad Click Prediction)的模型,主要解决CTR(点击率)预估问题。它是对Wide&Deep模型的进一步改进,能够自动学习特征交叉,有效捕获有限阶上的有效特征交叉,无需人工特征工程或暴力搜索,且计算代价较低。
695
7
14
Prometheus是由SoundCloud开发的开源监控系统,2016年被CNCF纳入为第二大开源项目,现已成为独立的开源项目,拥有活跃的开发人员和用户社区。它是一个针对云原生应用和分布式系统的监控和报警工具,提供了从监控数据搜集、存储、处理到可视化和告警的完整解决方案。项目地址:https://github.com/prometheus/prometheus
618
9
3
Gradient Boosting Machine(GBM,梯度提升机)是集成学习(Ensemble Learning)中Boosting 框架下的经典算法,核心思想是通过串行训练多个弱学习器(通常为决策树),逐步纠正前序模型的预测误差,最终构建一个强学习器。它凭借优异的预测性能,在分类、回归、排序等任务中被广泛应用,也是数据科学竞赛中的常用工具。
803
0
13
CatBoost是由俄罗斯搜索引擎巨头Yandex开发的高性能梯度提升决策树机器学习库,于2017年开源,采用Apache 2.0许可证,可免费开源使用。它是GBDT算法框架下的一种改进实现,主要用于解决分类和回归问题。基于对称决策树(oblivious trees)算法,通过构建多个简单预测器来逐步改进目标函数,从而形成一个强大的模型。
1180
4
4
Wide&Deep 是 Google 于 2016 年在论文《Wide & Deep Learning for Recommender Systems》中提出的机器学习模型,旨在解决推荐系统中“记忆性(Memorization)”与“泛化性(Generalization)”的平衡问题。该模型通过融合线性模型(Wide 部分)和深度学习模型(Deep 部分)的优势,在 Google Play 应用推荐等场景中取得了显著效果,成为推荐系统领域的经典模型之一。
652
4
6
DeepFM(Deep Factorization Machine)是一种用于点击率(CTR)预测的深度学习模型,它结合了因子分解机(FM)和深度神经网络(DNN)的优点,能够自动学习低阶和高阶的特征交叉,无需复杂的人工特征工程。一、模型架构DeepFM 主要包含 FM 部分和 Deep 部分。FM 部分用于学习低阶的交叉特征,能够有效捕捉数据中的一阶和二阶特征关系。Deep 部分则是一个全连接神经网络,用于学习高阶的交叉特征,通过多层神经元的非线性变换,挖掘数据中更复杂的特征组合。
1161
9
0
XGBoost(eXtreme Gradient Boosting)是一个开源的、高度优化的分布式梯度提升库。XGBoost 基于决策树算法,通过集成多个弱分类器以提升整体模型的性能。它在训练速度和模型表现上相比传统的梯度提升算法都有显著提升,是一种高效的、可扩展的梯度提升框架。该框架被广泛用于解决分类、回归、排序、推荐系统等各种类型的问题,在机器学习和数据科学领域应用十分广泛。同时,XGBoost 具有高性能和可扩展性,支持并行计算和分布式训练,能高效处理大规模特征和样本,可在多种分布式环境中运行,还能在 C++、Python、R、Java、Scala 等多种编程语言中使用。
888
9
3
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 (深数据® DEEPDATA® 极深®) 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号