HugeGraph于2016年在百度内部立项，最初用于解决安全反欺诈、威胁情报等业务场景的图数据存储需求。2018年8月正式开源，成为国内首个开源图数据库，并在GitHub上开放代码库。2022年，HugeGraph以全票通过成为Apache软件基金会首个图数据库孵化项目，2023年2月发布首个Apache版本，标志着其社区驱动的技术演进进入新阶段。

573

图数据库（TuGraph）

TuGraph图数据库由蚂蚁集团与清华大学联合研发，提供了完备的图数据库基础功能和成熟的产品设计，支持TB级别的数据规模。专注于处理超大规模图数据的存储、查询和分析。其核心技术源自蚂蚁集团在金融风控、交易网络等场景下的多年实践，目前已开源并逐步向企业级应用场景拓展。

2025-06-12

772

大型语言模型预训练（LLM360）

LLM360由Petuum和穆罕默德·本·扎耶德人工智能大学（MBZUAI）共同推出，是用于创建开源大型语言模型的项目，主要用于大型语言模型的预训练，为开发者提供大量高质量、多样化的数据，帮助其更轻松、快捷、经济地创建开源大型语言模型。LLM360已发布13个开源模型，涵盖K2等四个大型语言模型系列，提供模型检查点、代码、数据和模型开发的见解与细节；开源了庞大的完全清理过的预训练数据集TxT360，通过合并和去重99个CommonCrawl数据集和14个高质量数据源创建而成，在Hugging Face上排名第一，存储了丰富元数据，使预训练者能精确控制数据分布。

2025-06-11

1013

对象关系映射工具（Prisma）

Prisma是一个对象关系映射（ORM）工具，开发者以声明性的方式处理数据模型和业务逻辑，能轻松在不同数据库之间切换，提升代码的可移植性和灵活性。适用于Node.js和TypeScript应用程序。支持多种主流数据库系统，如PostgreSQL、MySQL、SQL Server等；原生支持TypeScript，提供类型安全的数据访问接口；具备强大的图形化界面Prisma Studio，为用户提供直观的数据浏览和操作环境；可以自动生成或更新数据库模式，基于定义的模型文件。

2025-06-11

742

RFM模型

RFM模型是一种用于衡量客户价值和客户创利能力的重要工具，广泛应用于市场营销、客户关系管理（CRM）等领域。它通过三个核心指标来分析客户的行为特征，评估客户价值，从而帮助企业制定更精准的营销策略。RFM模型由Jan Roelf Bult和Tom Wansbeek在20世纪90年代为目录零售组织开发。当时，企业面临着如何从大量客户中识别出高价值客户，以及如何制定针对性营销策略的问题。RFM模型应运而生，它通过三个关键指标——最近消费时间（Recency）、消费频率（Frequency）和消费金额（Monetary），帮助企业对客户进行细分和价值评估。随着数据库营销和客户关系管理的兴起，RFM模型逐渐被广泛应用于各个行业。它为企业提供了一种简单而有效的方法，能够深入了解客户行为，预测客户的购买潜力和忠诚度，从而优化营销资源的分配，提高营销效果。例如，在电商、零售、金融等行业，企业利用RFM模型来制定个性化的营销活动，如针对高价值客户提供专属优惠、针对休眠客户进行唤醒营销等。近年来，随着大数据和数据分析技术的不断发展，RFM模型也得到了进一步的完善和扩展。企业可以更轻松地收集和处理大量的客户数据，从而更精确地计算RFM指标，并结合其他数据维度进行更深入的分析。同时，机器学习和人工智能算法也被应用于RFM模型中，以提高客户细分的准确性和预测的精度。例如，通过聚类算法将客户分为不同的RFM群组，再利用预测模型预测每个群组客户的未来购买行为。

2025-06-10

917

如何采用聚类分析对用户群体进行精准分层？

采用聚类分析对用户群体进行精准分层，需要经历数据准备、指标筛选、算法选择、模型训练、结果解读及应用等核心步骤。一、实际应用案例1.银行客户价值分层数据与目标：银行拥有客户的消费指数、资产质量、风险状况、活跃度等信息和业务画像数据，希望通过聚类对客户价值进行分层，以设计营销白名单。

2025-06-10

1191

AI转型的认知跃迁

在数字技术狂飙突进的时代浪潮中，人工智能（AI）正以颠覆者的姿态重塑全球商业格局。亚马逊通过智能推荐算法，将用户购买转化率提升 35%，Netflix 依靠 AI 分析用户观看行为，每年节省 10 亿美元内容采购成本；特斯拉的自动驾驶技术重新定义汽车制造，大疆无人机利用 AI 视觉识别实现精准避障。从智能工厂的柔性生产到智能客服的 24 小时响应，从医疗影像的精准诊断到金融风险的实时预警，AI 技术的渗透已不再局限于单点应用，而是掀起了一场覆盖全产业链的深层变革。这种变革不仅是技术的迭代升级，更是对企业生存逻辑、竞争范式和发展方向的全面拷问，成为每一家志在长远的企业必须直面的战略命题。

2025-06-08

1028

思源笔记（siyuan-note）

一款隐私优先、可自托管、完全开源的个人知识管理软件，使用TypeScript和Go语言编写。为本地优先的块级笔记应用。引入双向链接图谱和块引用功能，强化知识网络构建。支持Markdown扩展语法（如LaTeX公式、流程图），提升专业场景适用性。持续优化性能，加强与AI工具集成，如接入大语言模型辅助写作。

2025-06-08

1039

智能知识管理解决方案（AnythingLLM）

AnythingLLM是Mintplex Labs Inc.推出的一个基于RAG（Retrieval - Augmented Generation）技术的全栈开源应用程序，旨在为企业和个人用户提供安全可控的智能知识管理解决方案，降低构建私有ChatGPT的技术门槛。以下是其具体介绍：一、主要功能多模型集成：全面支持OpenAI、Hugging Face等主流大语言模型，允许用户灵活切换本地与云端部署方案，可选择使用商业或开源的LLM，如开源的llama.cpp兼容模型、Anthropic ClaudeV2等。

2025-06-08

975

基于LSTM的时间序列预测模型开发

一、时间序列分析时间序列是指在一定时间内进行的一组测量值。时间序列分析的实例有很多，包括心电图、脑电图、气温、湿度、国家人口规模和近海潮汐高度等。其他一些例子还包括每年的太阳黑子数量、货币汇率、利率以及像洛伦兹吸引子这样的混沌系统。推断出既能充分解释观测数据，又能对样本外测量值（如测试数据集中的数据）进行泛化的模型至关重要。事实上，早期人们曾为了农业目的尝试预测天气，这些尝试促使人们对时间序列预测算法产生了兴趣。

2025-06-08

546

如何通过 LSTM 预测销量？

通过 LSTM（长短期记忆网络）预测销量是时间序列预测的常见应用场景，LSTM（长短期记忆网络，Long Short-Term Memory Network）是一种特殊的循环神经网络（RNN），专门设计用于解决传统 RNN 在处理长序列数据时面临的梯度消失（或爆炸）问题，从而能够有效捕捉序列中的长期依赖关系。

2025-06-08

916

联邦学习开源框架的选型比较

联邦学习的发展始于2010年前分布式机器学习与隐私计算的理论探索，2016年Google为优化手机输入法Gboard文本预测模型首次提出其概念，2017年通过论文正式确立技术框架，2018-2020年TFF、PySyft、FATE等开源框架陆续推出并推动学术研究爆发，2021-2023年在数据隐私法规驱动下于金融、医疗、物联网等行业规模化落地，2024年至今则与生成式AI、边缘计算、区块链等技术融合，国际标准与开源社区持续壮大，商业化生态走向成熟，从解决移动隐私问题的单一技术发展为覆盖多领域的交叉技术体系，未来有望在AGI隐私合规、元宇宙数据互信等前沿场景发挥关键作用。

2025-06-07

578

联邦学习开源框架（TFF）

TensorFlow Federated（TFF）是一个用于机器学习和深度学习的开源框架，它专注于实现联邦学习（Federated Learning）。联邦学习是一种机器学习技术，允许在多个设备或服务器上训练模型，同时保持数据的本地化，从而提高隐私保护和数据安全。2017年4月，Google AI团队推出了联邦学习的概念，为TFF的诞生奠定了理论基础。2019年，Google正式开源了TensorFlow Federated（TFF）框架，旨在为开发者提供一个用于去中心化数据的机器学习及运算实验的工具，它实现了联邦学习方法，允许在多种设备上训练共享的ML模型，同时数据无需离开设备，通过加密方式提供隐私保护。

2025-06-07

1148

图数据库与关系型数据库的全面对比：何时该选谁？

在数据库领域，关系型数据库长期占据主导地位，以其严谨的表结构、强大的事务处理能力，成为众多企业数据管理的基石。然而，随着数据量的爆炸式增长以及数据关系复杂度的提升，图数据库作为一种新兴力量崭露头角，为处理复杂关系数据提供了新的思路与方法。本文将从数据模型、存储方式、查询语言、事务处理等多个维度，深入对比图数据库和关系型数据库，并结合电商订单管理、知识图谱构建等具体业务场景，帮助读者清晰把握两者的适用边界，为企业数据库选型提供全面参考。

2025-06-06

1158

零知识证明的技术演进

零知识证明（Zero-Knowledge Proof, ZKP）凭借其“无需泄露具体信息即可验证事实”的特性，已在多个领域展现出巨大应用价值。1985年，Shafi Goldwasser、Silvio Micali和Charles Rackoff提出零知识证明概念。它指证明者能在不向验证者提供任何有用信息的情况下，使验证者相信某个论断正确。例如，证明者拥有房间钥匙，不用出示钥匙，只需用钥匙打开门拿出里面物体给验证者看，就可证明有钥匙，且验证者看不到钥匙样子。

2025-06-06

785

微软Athena智能体

微软Athena智能体是微软公司于2025年6月4日宣布整合到Teams应用中的AI智能体。微软在智能体技术方面核心依托大规模多模态深度学习模型，其2024年推出的多模态大模型参数规模已突破千万亿级。Athena利用其在自然语言处理和计算机视觉等多领域的强大性能，来理解复杂语义、实现自主规划和协作等功能。

2025-06-05

1092

零知识证明如何应用于数字版权管理

创作者可以使用零知识证明向平台或消费者证明自己对作品的版权归属，而不泄露作品的具体内容或创作过程，保护作品的知识产权。同时，消费者也可以通过零知识证明验证作品的版权合法性，避免购买到侵权作品。零知识证明（Zero-Knowledge Proof, ZKP）是一种密码学技术，允许一方（证明者）在不向另一方（验证者）泄露任何具体信息的前提下，证明某个命题为真。其核心思想是：证明过程无需透露“知识本身”，只需证明“拥有知识”这一事实。

2025-06-05

772

联邦学习与边缘计算的融合

在物联网（IoT）快速发展的时代，数以亿计的边缘设备如传感器、智能终端等持续产生海量数据。然而，将这些数据全部传输至云端进行处理，不仅面临高昂的网络带宽成本和较长的传输延迟，还存在严重的隐私泄露风险。在此背景下，联邦学习与边缘计算的融合为物联网数据处理提供了新的解决方案，展现出巨大的应用潜力。

2025-06-04

1088

全息空中光场显示技术（HALFDT）

全息空中光场显示技术（Holographic Aerial Light Field Display Technology，HALFDT）是一种融合光学、计算机图形学、传感器技术等多领域的前沿显示技术，在不依赖任何介质（如屏幕、眼镜）的情况下，直接在真实空间中生成悬浮的三维立体图像，并实现人与图像的自然交互。其核心目标是突破传统二维显示的局限，构建更接近真实世界感知的沉浸式体验。

2025-06-03

781

实用拜占庭容错算法（PBFT）

拜占庭容错（Byzantine Fault Tolerance, BFT）的理论根源可追溯至 1982 年兰伯特（Lamport）等人提出的 “拜占庭将军问题”—— 分布式系统中，部分节点可能因故障或恶意行为发送矛盾信息，导致系统共识失效。传统分布式协议（如 Paxos、Raft）仅能处理节点宕机（崩溃容错），而 BFT 需进一步应对恶意节点的主动攻击（如数据篡改、双重支付）。实用拜占庭容错算法（Practical Byzantine Fault Tolerance, PBFT）的诞生标志着 BFT 理论从学术走向工程实践。1999 年，MIT 团队针对传统 BFT 算法复杂度高（消息复杂度达 O(n³) 的缺陷，通过优化消息交互流程与状态机复制机制，将共识延迟降至 O(n²) ，使 BFT 首次适用于实时交易场景。该算法的核心突破在于：引入视图（View）概念：通过主节点轮换机制避免单一节点作恶或性能瓶颈；三阶段轻量级协议：将复杂的投票过程拆解为预准备、准备、提交，减少冗余通信；确定性最终性：区别于 PoW 的概率性确认，区块一旦提交即不可逆转，满足金融级可靠性需求。

2025-06-03

872

- -