THULAC（THU Lexical Analyzer for Chinese）是一个中文词法分析工具包，具有中文分词和词性标注功能。它利用大规模人工分词和词性标注中文语料库训练而成，模型性能强大，处理速度快。由清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包。一、主要功能

754

深度学习图像分类（Jittor）

计图（Jittor）是清华大学自主研发的深度学习框架，它支持元算子和即时编译，提供了图像分类等多种深度学习任务的实现示例和教程。Jittor具有高效的计算能力和灵活的编程接口。和其他深度学习框架（如TensorFlow、PyTorch）类似，Jittor的目标是帮助开发者更方便地构建和训练神经网络模型。

2024-11-17

1029

知识管理系统（KMSphere）

KMSphere是中国科学院计算技术研究所智能科学实验室研制的知识管理系统，包括OntoSphere、OntoManager和OntoService三个部分，分别用于半自动本体获取、可视化本体管理编辑和基于多主体系统的知识共享服务。知识发现是从数据中挖掘知识的过程。企业知识中台是一种基于人工智能技术形成的智能化知识解决方案，它具有全链路的知识管理能力，覆盖知识的高效生产、灵活组织和智能应用。知识中台能够自动化地从数据中提取知识，在业务场景中的人机互动里主动推荐知识，帮助业务人员高效、精准、智能地制定决策，提升企业的经营效率与业务创新能力。随着企业数字化进程的推进，IT系统数量逐步增加，数据通常分散在不同的系统中。知识中台汇聚全量数据，依靠智能技术从数据中自动挖掘各类型知识，服务前台业务系统。

2024-11-16

1193

开源 AI 换脸（DeepFaceLab）

DeepFaceLab是在 Python 上运行的开源深度伪造技术平台。它可以实现将一张脸换成另一张脸，还可以用来去除皱纹及其他表明年迈的标记等操作。不过，深度伪造技术的使用也引发了一些伦理和法律方面的争议，在使用时需要谨慎考虑。DeepFaceLab基于 TensorFlow 框架。一、功能特点

2024-11-16

1079

神经网络建模库（OpenNN）

OpenNN是一个用 C++ 编写的开源类库，实现了神经网络建模。基于 R. Lopez 在 2008 年泰罗尼亚技术大学的博士论文开发而成，可以使用一组函数实现数据挖掘，并通过 API 将这些函数嵌入到其他软件工具中，使软件工具和预测分析任务之间进行交互。具有高性能、内存管理好、处理速度快等优点。

2024-11-15

527

图像分类和目标检测（DeepDetect）

DeepDetect是一个专注于图像分类和目标检测的开源深度学习平台。它基于 C++ 编写，具有高效的计算性能和较低的内存占用。DeepDetect 提供了简单易用的 API，方便开发者快速构建图像分类系统。它支持多种深度学习模型，如卷积神经网络等，并且可以根据用户的需求进行定制和扩展。在实际应用中，DeepDetect 可以用于构建智能安防系统、图像搜索引擎等。

2024-11-15

552

智能合约框架平台（POA Network）

POA Network 提供智能合约的开源框架平台，并推出了 BlockScout。BlockScout 是以太坊生态系统的第一个全功能开源区块链浏览器工具，用户可以搜索和浏览以太坊、以太坊经典和 POA 网络区块链上的交易、地址和余额等信息。它为开发人员提供了广泛的功能、灵活的 API 以及对 ERC20 和 ERC721 代币的支持，还支持智能合约验证和查询等功能。POA项目是2017年度318笔成功融资的项目中唯一一个在融资前已经代码库开发完备，用超高的工作效率和最快的速度分发完代币的同时发布了自己的主网、区块链浏览器，并实现了跨链应用。开发了开源区块链浏览器BlockScout、多链资产转移解决方案Token Bridge，以及基于稳定币的网络xDai Network等产品和工具，以改善整个生态系统的互操作性、基础架构和透明度。

2024-11-14

970

开源照片管理工具（PhotoPrism）

PhotoPrism是一款基于 TensorFlow 的开源照片管理工具，虽然主要功能是照片管理，但也具备自动图像分类的能力。能够精准检测图片的颜色、色度、亮度、质量等属性，还可以识别全景照片、地理位置信息、黑白照片等。支持中文界面，部署相对简单，通过 Web 界面即可方便地访问和管理照片。

2024-11-14

830

智能合约平台（Ethereum）

以太坊（Ethereum）是最早且最具影响力的智能合约平台之一，拥有庞大的开发者社区和丰富的生态系统。它的智能合约编程语言主要是 Solidity，类似于 JavaScript，开发者可以使用 Solidity 编写智能合约并部署到以太坊区块链上。以太坊有许多开源的工具、库和框架，方便开发者进行智能合约的开发、测试和部署。例如 Truffle 是一个广泛使用的以太坊智能合约开发框架，它提供了智能合约编译、部署、测试等一系列功能，帮助开发者更高效地进行以太坊智能合约开发。

2024-11-14

1141

深度学习平台（DJL）

DeepJavalibrary（DJL）由亚马逊公司开源。是一个完全使用 Java 构建的高层次的、引擎无关的深度学习平台，解决了 Java 开发者在深度学习开发中的痛点。它提供了简单的项目配置和丰富的运行环境，支持多种深度学习引擎，如 Apache MXNet、PyTorch、TensorFlow 等。适合 Java 开发者进行深度学习应用的开发，在企业级应用中具有一定的潜力。

2024-11-13

1147

AI搜索的发展趋势

AI 搜索是一种利用人工智能技术来实现信息检索和提供答案的搜索方式。一、核心技术基础1.自然语言处理这是 AI 搜索的基础技术，能够使计算机理解和处理人类语言的复杂性和多样性。通过词法分析、句法分析和语义理解等技术，将用户输入的自然语言查询转化为计算机可理解的形式，从而准确识别用户的搜索意图。例如，当用户输入 “介绍一下健康的饮食搭配”，AI 搜索系统可以理解 “健康”“饮食搭配” 等关键信息。

2024-11-13

533

医疗大语言模型（CareLlama）

CareLlama（关怀羊驼）是开源医疗大模型，同时收集了数十个公开可用的医疗微调数据集和开放可用的医疗大语言模型，以促进医疗 LLM 的快速发展。项目地址：https://github.com/itsharex/carellama。一、主要特点1. 数据丰富：集合了数十个公开可用的医疗微调数据集，这为模型提供了丰富的医疗领域知识和信息，有助于模型在医疗相关任务上的表现。

2024-11-13

817

中文医疗大模型（ChatMed）

ChatMed开源了中文医疗大模型 ChatMedConsult，以中文医疗在线问诊数据集的 50 万+在线问诊+ChatGPT 回复作为训练集，基于 Llama7B 采用 LoRA 微调得到。一、主要模型及特点1.ChatMedconsult：训练数据：基于中文医疗在线问诊数据集的 50 万+在线问诊以及 ChatGPT 的回复作为训练集。在线问诊数据能反映真实的用户问诊需求，但网上回答质量参差不齐，所以借助 ChatGPT 的回复来提高数据质量。

2024-11-12

874

增强现实库（ARToolKit）

ARToolKit是一个用 C/C++语言编写的库，用于开发增强现实应用程序。它可以帮助开发者实时地将虚拟图像覆盖到真实世界画面中，并能准确地对齐虚拟和现实对象，为用户提供增强现实体验。目前支持多种操作系统，如 SGI Irix、PC Linux、Mac OSX、PC Windows（95/98/NT/2000/XP）等，应用场景广泛，包括教育、军事、古迹复原、工业维修等领域。

2024-11-12

1095

企业资源规划（ERP）系统（Odoo）

Odoo是当前开源排名第一的 ERP 系统，功能丰富，集成了生产、采购、销售、库存、营销、财务、人力资源等多个模块，一站式管理企业的业务流程。其架构设计合理，扩展性和定制性强，适用于各种规模的企业。Odoo在2005年发布了第一个版本Tiny ERP。Odoo 8引入了受欢迎的电子商务模块，并改进了可用性和在线客户端。 Odoo 9有多种配置。2017年的Odoo 11发布了Odoo Studio，用于创建应用程序。

2024-11-11

787

数据——产品和运营的黏合剂

用户使用产品，就是寻求解决方案。产品连接的是用户需求和解决方案。产品不会只满足一种需求，产品是在不同场景下解决方案的集合。产品连接的是不同的用户需求和不同的解决方案，用户也是一个集合。解决方案是一个很磨人的玩意，在产品开始设计时我们并不知道

2024-11-11

1116

区块链平台（XuperChain）

XuperChain采用百度的底层区块链技术架构，是超级链体系下的第一个开源项目。它设计上采用了模块化、插件化的方式，具有高性能、安全、高可扩展、支持多语言开发智能合约等特点。智能合约、共识机制等能力被拆解成单个模块，开发者可以根据场景应用需求进行灵活调用，让区块链应用的搭建更加高效。并且它支持全球部署，可在高效的广域网数据交换。

2024-11-10

1152

法律大模型（ChatLaw）

ChatLaw是一个法律领域的大模型产品，不仅仅是一个模型，而是具有较好产品形态的法律领域应用。由北大团队发布的中文法律大模型项目官网：https://www.chatlaw.cloud/。其主要目的是为普通人提供普惠的法律服务。ChatLawtext2vec版本使用93万条判决案例做成的向量数据集，基于bert训练的相似度匹配模型，能够根据用户提问的内容检索到最相关的法律条文。

2024-11-10

1015

分布式机器学习平台（Angel）

Angel 是腾讯自主研发并开源的面向企业级应用的高性能分布式机器学习平台。Angel作为一个高性能分布式机器学习平台，其设计和实现兼顾了工业界的高可用性和学术界的创新性，适用于大规模机器学习任务，特别是在稀疏数据和高维模型方面表现出色。全栈机器学习服务：Angel支持特征工程、模型构建、参数训练、AutoML、模型服务Serving等全栈机器学习服务。提供机器学习、深度学习、图神经网络等多种算法，支持几万亿级超大规模参数模型的训练。

2024-11-09

502

开源智能合约平台（Juno）

Juno 是由 Kadena 公司开发的一个开源智能合约平台，基于 Substrate 框架构建。它集成了 Solidity 虚拟机（EVM），支持与以太坊兼容的智能合约，开发者可以无缝迁移现有的以太坊智能合约到 Juno 平台上。Juno 采用了 Kadena 的 Pact 语言作为系统级编程语言，具有内置的安全性和可读性，降低了智能合约漏洞的风险。此外，Juno 还利用了 Kadena 的 Chainweb 共识机制，提供了高交易吞吐量和良好的网络弹性。

2024-11-09

579

- -