登录
AReaL(Ant Reasoning RL)是由蚂蚁技术研究院与清华大学交叉信息研究院联合开发的开源强化学习框架,专注于提升大型推理模型(LRM)的复杂逻辑推理能力。通过完全开放的技术生态,让开发者以极低门槛复现、优化甚至超越当前SOTA模型,尤其在数学推理等长链逻辑任务中展现出显著优势。
1
8
8
VLM-R1是由浙江大学滨江研究院Om AI Lab开源的多模态视觉推理模型,聚焦复杂场景理解与自主推理路径构建,通过强化学习与视觉语言模型的深度融合,在多模态任务中展现出突破性能力。项目地址:https://github.com/om-ai-lab/VLM-R1一、技术架构VLM-R1采用视觉-语言-强化学习三层异构融合架构,实现多模态信息的深度交互与推理路径的自主生成:
1
5
9
在语义网与知识图谱体系中,本体(Ontology) 是形式化表示领域知识的核心载体,它通过定义“概念(类)、角色(属性)、个体”及三者间的逻辑关系,实现知识的结构化与语义化。但本体仅能存储“显式知识”,若要挖掘隐含知识(如“本科生是学生”的从属关系)、验证知识一致性(如“无脊椎动物有脊椎”的矛盾检测),则需依赖本体推理机。
583
6
14
Neural-Symbolic-Machines核心目标是解决弱监督场景下的语义解析与程序合成问题,由Liang等人开发,相关成果发表于NeurIPS 2018和ACL 2017等顶会,目前遵循Apache-2.0开源协议。融合神经网络与符号计算,支持程序合成与语义解析。 项目地址:https://github.com/crazydonkey200/Neural-Symbolic-Machines
502
4
2
OpenCog 是面向通用人工智能(AGI)的开源认知架构框架,核心目标是构建具备人类级通用智能的系统——即能够像人类一样跨领域学习、推理、自适应环境,并自主解决复杂未知问题,而非局限于单一任务(如图像识别、自然语言处理)。它源于2008年,由人工智能研究者 Ben Goertzel 主导发起,最初依托于 Hanson Robotics(开发“索菲亚机器人”的团队)等机构,目前由全球开源社区维护,核心理念是“通过模拟人类认知的多模块协同,实现智能的涌现”。
1005
3
9
PIKE-RAG是微软开源的企业级RAG系统,支持任务分解(事实性→创造性)与混合检索。面向中大型企业的私有化/半私有化RAG系统,区别于通用RAG(如基于公开数据的问答工具),它以“企业内部知识资产激活”为核心,通过“检索增强+业务规则注入”,将企业分散的文档、数据库、API等知识转化为可直接支撑业务决策、客户服务、内部协同的智能能力。所有数据处理环节遵循企业级安全规范(如数据本地化存储、细粒度权限控制、操作审计日志),符合GDPR、等保2.0等合规要求。适配企业“结构化+非结构化+多模态”全类型数据,打破OA、CRM、ERP、文档库等系统的数据孤岛不追求“通用问答能力”,而是深度绑定企业具体业务场景(如金融合规、制造维修、研发协同),支持业务规则自定义注入。具备知识自动更新(如监控文档库变化同步更新索引)、检索策略动态调优(基于用户反馈优化排序)的能力。
595
8
1
CogQA是清华大学团队提出的多跳问答框架,其核心设计灵感源自认知科学中的双过程理论(Dual Process Theory),旨在模拟人类大脑解决复杂问题时的“直觉检索”与“逻辑推理”协同机制。基于认知科学的双过程理论,结合隐式提取模块(系统1)和显式推理模块(系统2)构建认知图。通过迭代扩展图结构,逐步整合多跳信息,提供可解释的推理路径。
1073
9
1
FiD(Fusion-in-Decoder)是Facebook AI Research(FAIR)提出的检索-生成一体化知识密集型问答模型,通过动态融合外部知识库与生成式语言模型,实现高效准确的多跳推理。其核心设计突破传统检索-阅读流水线的局限性,在解码器阶段直接整合多段落信息,尤其适用于开放域问答(OpenQA)和复杂事实推理任务。FiD(Fusion-in-Decoder)结合召回和生成的KBQA模型,利用外部知识库增强问答。通过检索相关文本并与问题拼接,解码器融合多源信息生成答案。
1153
2
8
KnowFormer通过自注意力机制直接建模实体间的结构关联。设计结构感知的注意力模块,动态评估实体间连接合理性,解决路径缺失和信息稀释问题。 KnowFormer是由中关村实验室、北京航空航天大学和南洋理工大学联合研发的前沿模型,其核心目标是解决知识图谱(KG)的不完整性问题,通过Transformer架构实现高效的结构化知识推理。KnowFormer的核心算法发表于ICML 2024(论文链接:[https://一、技术原理与架构设计
590
9
1
垂直领域知识预训练模型KANGAROO由阿里云人工智能平台PAI与华东师范大学合作研发,在EMNLP 2023会议上正式发布。该模型针对垂直领域知识图谱的全局稀疏、局部稠密特性,提出了双曲空间嵌入与对比学习相结合的创新框架,有效提升了领域内语义理解和知识推理能力。项目地址:https://github.com/alibaba/EasyNLP
848
4
13
RoG(Reasoning on Graphs)提出“规划-检索-推理”框架,利用知识图谱的关系路径生成忠实的推理计划。LLM通过关系路径生成查询,结合图谱结构指导推理过程,解决LLM的幻觉问题。 RoG是由研究者Linhao Luo、Yuan-Fang Li、Gholamreza Haffari和Shirui Pan等人联合开发的创新推理框架,其研究论文《Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning》已被ICLR 2024接收。
830
9
2
LightPROF 是由北京邮电大学、新加坡国立大学等机构联合提出的轻量级知识图谱推理框架,专为解决大语言模型(LLM)在复杂知识问答(KGQA)中的效率与准确性问题而设计。其核心目标是通过知识图谱结构信息的深度整合,在不依赖大规模参数模型的前提下,显著提升小模型的推理能力。该框架已被 AAAI 2025 接收为长文,并在 WebQSP 和 CWQ 等权威数据集上实现了超越 ChatGPT 等大模型的性能。
960
0
5
图数据库的性能与可扩展性直接决定业务场景(如实时风控、知识图谱分析)的落地效果,需结合业务场景特性(OLTP/OLAP)、技术指标(响应时间、吞吐量)和扩展能力(数据量/节点扩展)构建评估体系。一、性能评估聚焦“查询效率”与“并发稳定性”,性能评估需区分事务型(OLTP,如实时反欺诈) 和分析型(OLAP,如用户行为分析) 场景,两类场景的评估重点差异显著。
954
8
3
图数据库是一种以图结构(节点、边、属性)存储和查询数据的非关系型数据库,其核心优势在于直接建模实体间的复杂关系,尤其适用于社交网络、金融风控、知识图谱等需要多跳关联分析的场景。与传统关系型数据库相比,图数据库通过邻接列表而非表连接实现数据关联,在处理深度遍历(如 5 跳以上路径查询)时效率可提升数十倍至数千倍。例如,Neo4j 在金融反欺诈场景中可实现毫秒级多跳查询,而传统数据库需耗时数秒甚至更长。
962
9
10
Memgraph是一个内存优化图数据库,支持实时流处理和机器学习集成,提供MAGE图算法库。 Memgraph是一款专为高性能实时分析设计的开源图数据库,由总部位于伦敦的同名公司开发,核心团队来自克罗地亚萨格勒布大学。其核心目标是通过内存优先架构和创新的存储模型,解决传统图数据库在处理复杂关系数据时的性能瓶颈。自2019年开源以来,Memgraph 已在金融、医疗、供应链等领域落地,客户包括 NASA、Cedars-Sinai 医疗中心等机构。
1174
8
6
Stardog 是全球领先的企业级知识图谱平台,由 Stardog Union 公司于2010年推出,总部位于美国纽约。作为知识图谱领域的标杆产品,其核心使命是通过语义技术实现数据的智能互联,解决企业数据孤岛问题。经过多年发展,Stardog 已完成 A 轮(2017年,600万美元)和 B 轮(2019年,900万美元)融资,客户覆盖摩根士丹利、博世、NASA 等全球顶级机构。
618
6
9
Dgraph 是一款专为处理复杂关系数据设计的开源分布式图数据库,核心目标是提供高性能、高可扩展性的图数据存储与查询能力。其设计融合了原生图模型与分布式架构,支持 GraphQL 查询语言,适用于社交网络、知识图谱、推荐系统等场景。项目地址:https://github.com/dgraph-io/dgraph
1158
0
9
语音合成(TTS)开源项目是技术研究与产业落地的核心支撑,不同项目因技术路线、设计目标差异,在语言覆盖、合成自然度、可扩展性等方面表现悬殊。本文选取当前开源生态中应用最广、影响力最大的五大 TTS 项目——MaryTTS、Coqui TTS、eSpeak、Festival、VITS,从核心信息、技术架构、关键能力、生态表现、适用场景五大维度展开深度对比,为不同需求场景下的项目选型提供参考。
508
9
8
在语音合成(TTS)技术从 “分步拼接” 向 “端到端生成” 演进的过程中,谷歌于 2017 年开源的 Tacotron 2 模型无疑是里程碑式的存在。它首次打破传统 TTS“文本预处理→音素预测→韵律建模→语音合成” 的多阶段流程,构建了 “文本直接映射至语音” 的端到端框架,为后续开源 TTS 技术的发展奠定了核心架构基础。
785
1
10
在语音合成(TTS,Text-to-Speech)技术飞速发展的当下,开源项目为技术研究与产业应用提供了重要支撑。MaryTTS 作为一款历史悠久的开源 TTS 项目,凭借其跨平台特性、完整功能链及高可扩展性,在学术研究与中小型应用场景中占据重要地位。一、项目介绍MaryTTS 诞生于德国达姆施塔特工业大学(TU Darmstadt)与德国人工智能研究中心(DFKI)的合作项目,自 2000 年前后启动至今,已形成成熟稳定的技术架构,是开源 TTS 领域的 “元老级” 项目之一。该项目基于 Java 语言开发,完全遵循开源协议(Apache License 2.0),开发者可自由获取源代码、修改功能模块或集成至自有系统。
919
0
4
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号