登录
Fairseq是一个基于卷积神经网络的机器翻译项目,使用一种全新的卷积神经网络进行语言翻译,能以 9 倍于以往循环神经网络的速度实现目前最高准确率。Fairseq由Facebook AI Research(FAIR)于2017年首次开源,最初聚焦于卷积神经网络(CNN)在机器翻译中的应用,并在WMT 2014英语-法语任务上达到当时最优性能(BLEU提升1.5),速度比传统RNN快9倍。2018年后,Fairseq逐步引入Transformer架构,并成为主流模型支持方案。2020年,Fairseq 0.10.0版本整合Hydra配置框架,提升了实验管理的灵活性。2022年,FAIR启动Fairseq v2项目,目标是重构代码库、增强可扩展性,并计划实现与PyTorch生态的深度融合。2025年,Fairseq2正式发布,新增指令微调、张量并行训练(支持70B+模型)、与VLLM集成等功能,进一步巩固其在NLP研究和工业界的地位。
1
9
7
MeshNet是清华大学团队在AAAI 2019提出的3D形状表示神经网络项目。通过神经网络技术处理和分析3D模型数据,适用于计算机辅助设计、医学图像处理、虚拟现实和增强现实等领域。项目地址:https://github.com/iMoonLab/MeshNet 一、简介MeshNet专注于解决3D网格数据的不规则性和复杂性问题,通过创新的面单元(Face-unit)和特征分割(Feature Splitting)机制,直接在网格上进行端到端学习。其核心目标是实现高精度的3D形状分类与检索任务。在优化后的Manifold40数据集(水密网格,每个模型500面)上,MeshNet达到了92.75%的分类准确率,显著优于传统方法和基于其他数据形式的模型。
1
3
10
OpenYurt由阿里巴巴云原生团队开发,于2020年5月29日正式开源,作为阿里云边缘容器服务ACK@Edge的核心框架,最初应用于CDN、音视频直播、物联网等场景。项目在2021年加入云原生计算基金会(CNCF)沙箱项目,2023年晋升为CNCF孵化项目,截至2025年仍保持沙箱状态,持续推动云边协同技术标准化。
789
3
4
co - snarks用于实现多方协作的零知识证明。它基于现有的领域特定语言circom和Noir,通过coCircom和coNoir两个主要工具,让多个互不信任的参与方能够协作计算出一个零知识证明。coCircom允许现有的circom电路无缝升级为coSNARKs,无需修改原始电路,且完全兼容Groth16和Plonk后端,生成的证明可以使用snarkjs验证。co - snarks项目采用Rust语言开发,应用场景广泛,特别是在区块链隐私保护、多方计算协议以及数据共享与协作等需要保护隐私的多方计算环境中。
847
9
3
CreateX是一个开源的智能合约部署工厂,核心是用Solidity编写的智能合约,通过利用Ethereum虚拟机的CREATE、CREATE2和CREATE3指令,使得智能合约的部署更加便捷和安全。具有高度可扩展性,支持部署权限控制、跨链部署等功能,还能通过内置的只读函数计算基于CREATE和CREATE2部署的智能合约地址。
1007
5
7
BaseCamp基于成熟的区块链技术构建,深度整合了智能合约的编写、测试、部署与监控的一站式解决方案。采用高效的语言框架,如Solidity或Vyper,确保了智能合约的安全性和执行效率。独特的模块化设计允许开发者轻松定制功能,适应多样化的业务需求,应用场景极为广泛,几乎覆盖了所有区块链可以触及的行业。
1025
3
7
Chainlink专注于为智能合约提供链下数据,例如价格数据、随机数等,数据可靠,可信度高。本质上是一个为区块链网络和链外提供服务的分布式预言机网络,通过预言机能够把信息从链下传递到链上,实现现实世界的信息与区块链进行交互。Chainlink的核心构想始于2014年,创始人Sergey Nazarov和Steve Ellis意识到区块链智能合约无法直接访问链外数据的痛点,决心构建去中心化预言机网络。2017年,Chainlink在以太坊ICO热潮中完成募资,筹集3200万美元,并正式启动开发。
790
5
10
TFHE(Fast Fully Homomorphic Encryption Library over the Torus)是一个在环上的快速全同态加密库。自2016年发展至今已成熟,遵循Apache 2.0许可协议。它基于极快门级引导技术,利用优化过的Ring - variant GSW系统及高级CPU指令集加速计算,单核上能以约13毫秒的时间同态执行任意二进制门运算,性能卓越,适用于多种应用场景,尤其是云端加密计算。设计目标是在保持加密安全性的前提下,大幅提升密文计算的效率。
884
1
13
高度可定制的区块链平台,Avalanche(AVAX)是由康奈尔大学教授Emin Gün Sirer团队创立的高性能Layer 1区块链平台,通过创新共识机制和模块化架构解决区块链可扩展性问题。2020年Avalanche主网正式上线,标志着三链架构(X/P/C链)和雪崩共识机制的落地。2021年推出跨链桥Avalanche Bridge,实现与以太坊的资产互通,吸引Aave、Curve等头部DeFi协议入驻。2022年Banff升级引入子网质押机制,支持企业定制化区块链,与德勤合作推出政府救济金平台CAYG。
1149
1
2
Polkadot是一种跨链技术平台,实现不同区块链之间的互操作性和数据传输。是一个跨链互操作性协议,支持多链并行和跨链资产转移。Polkadot 由以太坊联合创始人 Gavin Wood 于 2016 年提出,是首个实现异构区块链跨链通信的分布式系统。其核心目标是解决区块链行业的「碎片化」问题,通过中继链、平行链与转接桥的三层架构,构建「区块链互联网」,允许不同链间的资产、数据与计算能力自由流动。截至 2025 年,Polkadot 已接入超 200 条平行链,生态涵盖 DeFi、NFT、供应链等 30 + 行业,成为跨链技术的标杆平台。
797
3
7
emp - tool:是一个开源的同态加密库,采用先进的同态加密技术,基于伪随机数生成器、伪随机置换、哈希函数和承诺方案等核心技术和算法,使得加密数据在不解密的情况下即可进行计算。具有安全性高、易用性好、跨平台和高性能等特点,适用于加密搜索、安全多方计算、隐私保护分析和安全云服务等场景。
1062
2
12
OpenZeppelin是一个开源的智能合约框架,广泛应用于以太坊和其他兼容EVM区块链上开发去中心化应用和智能合约。提供了一组经过审计和验证的安全合约库,涵盖ERC标准、代币、访问控制等常用功能。OpenZeppelin 成立于 2015 年,由 Allan Pedersen、Fabian Vogelsteller 等开发者创立,目的是解决以太坊智能合约开发中的安全问题。
851
9
3
一个专注于高效实现加密原语的开源库。其核心技术栈丰富,包括高效的有限域运算、椭圆曲线和多标量乘法等数学库,支持Poseidon、Pedersen和BLS12 - 381等多种零知识友好的哈希函数和椭圆曲线,还涵盖了STARK、Plonk、Groth16等多种证明系统。它支持多种硬件加速技术,如CUDA、Metal和WebGPU,适用于区块链、分布式系统和云计算等多个领域,开发者可以利用它轻松构建和部署高效的零知识证明系统。
831
2
13
NebulaGraph 是一款广受欢迎的开源图数据库,它能够以毫秒级延迟处理海量数据,可快速扩展,并具备执行快速图分析的能力。NebulaGraph已广泛应用于社交媒体、推荐系统、知识图谱、安全、资金流、人工智能等领域。核心团队早在2005年便开始参与图数据库研发,曾主导蚂蚁金服分布式图数据库GeaBase的开发。2018年母公司悦数科技成立,专注于分布式图数据库技术研发。2019年5月,NebulaGraph 1.0版本正式开源,采用原生分布式架构,支持千亿级节点和万亿级边存储。2020年完成Pre-A轮融资(800万美元)和Pre-A+轮融资(近千万美元),由红点中国、经纬中国等投资,加速全球商业化布局。2022年推出云原生图数据库服务 NebulaGraph Cloud,实现分钟级云上自动化部署,并与阿里云深度集成。同年获得数千万美元A轮融资,由时代资本领投,推动产品研发和企业级市场拓展。2023年8月与LlamaIndex联合发布 GraphRAG 技术,率先将图数据库与生成式AI结合,解决传统RAG在知识关联和上下文理解上的不足。
650
2
10
HugeGraph于2016年在百度内部立项,最初用于解决安全反欺诈、威胁情报等业务场景的图数据存储需求。2018年8月正式开源,成为国内首个开源图数据库,并在GitHub上开放代码库。2022年,HugeGraph以全票通过成为Apache软件基金会首个图数据库孵化项目,2023年2月发布首个Apache版本,标志着其社区驱动的技术演进进入新阶段。
1071
8
0
TuGraph图数据库由蚂蚁集团与清华大学联合研发,提供了完备的图数据库基础功能和成熟的产品设计,支持TB级别的数据规模。专注于处理超大规模图数据的存储、查询和分析。其核心技术源自蚂蚁集团在金融风控、交易网络等场景下的多年实践,目前已开源并逐步向企业级应用场景拓展。
582
7
4
LLM360由Petuum和穆罕默德·本·扎耶德人工智能大学(MBZUAI)共同推出,是用于创建开源大型语言模型的项目,主要用于大型语言模型的预训练,为开发者提供大量高质量、多样化的数据,帮助其更轻松、快捷、经济地创建开源大型语言模型。LLM360已发布13个开源模型,涵盖K2等四个大型语言模型系列,提供模型检查点、代码、数据和模型开发的见解与细节;开源了庞大的完全清理过的预训练数据集TxT360,通过合并和去重99个CommonCrawl数据集和14个高质量数据源创建而成,在Hugging Face上排名第一,存储了丰富元数据,使预训练者能精确控制数据分布。
757
2
1
Prisma是一个对象关系映射(ORM)工具,开发者以声明性的方式处理数据模型和业务逻辑,能轻松在不同数据库之间切换,提升代码的可移植性和灵活性。适用于Node.js和TypeScript应用程序。支持多种主流数据库系统,如PostgreSQL、MySQL、SQL Server等;原生支持TypeScript,提供类型安全的数据访问接口;具备强大的图形化界面Prisma Studio,为用户提供直观的数据浏览和操作环境;可以自动生成或更新数据库模式,基于定义的模型文件。
1132
2
9
RFM模型是一种用于衡量客户价值和客户创利能力的重要工具,广泛应用于市场营销、客户关系管理(CRM)等领域。它通过三个核心指标来分析客户的行为特征,评估客户价值,从而帮助企业制定更精准的营销策略。RFM模型由Jan Roelf Bult和Tom Wansbeek在20世纪90年代为目录零售组织开发。当时,企业面临着如何从大量客户中识别出高价值客户,以及如何制定针对性营销策略的问题。RFM模型应运而生,它通过三个关键指标——最近消费时间(Recency)、消费频率(Frequency)和消费金额(Monetary),帮助企业对客户进行细分和价值评估。随着数据库营销和客户关系管理的兴起,RFM模型逐渐被广泛应用于各个行业。它为企业提供了一种简单而有效的方法,能够深入了解客户行为,预测客户的购买潜力和忠诚度,从而优化营销资源的分配,提高营销效果。例如,在电商、零售、金融等行业,企业利用RFM模型来制定个性化的营销活动,如针对高价值客户提供专属优惠、针对休眠客户进行唤醒营销等。近年来,随着大数据和数据分析技术的不断发展,RFM模型也得到了进一步的完善和扩展。企业可以更轻松地收集和处理大量的客户数据,从而更精确地计算RFM指标,并结合其他数据维度进行更深入的分析。同时,机器学习和人工智能算法也被应用于RFM模型中,以提高客户细分的准确性和预测的精度。例如,通过聚类算法将客户分为不同的RFM群组,再利用预测模型预测每个群组客户的未来购买行为。
969
9
11
采用聚类分析对用户群体进行精准分层,需要经历数据准备、指标筛选、算法选择、模型训练、结果解读及应用等核心步骤。一、实际应用案例1.银行客户价值分层数据与目标:银行拥有客户的消费指数、资产质量、风险状况、活跃度等信息和业务画像数据,希望通过聚类对客户价值进行分层,以设计营销白名单。
733
4
3
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号