登录
主页
 文章
OmniParser是一款开源工具,可通过解析用户界面截图生成结构化数据,助力打造视觉驱动的 GUI 自动化代理,赋能跨平台交互。项目地址:https://github.com/microsoft/OmniParser一、技术原理1.数据集构建:从流行网页和应用中提取数据,构建可交互图标检测数据集和图标描述数据集,为模型训练提供基础。
975
9
9
Shotcut跨平台支持Windows、Mac、Linux和Android;支持4K、8K视频处理,可进行帧精确搜索和视频合成,有丰富的滤镜和特效;音频编辑功能强大,配备示波器和多种滤波器,支持淡入淡出等过渡效果;无需导入即可直接在时间线上编辑,支持HTTP、HLS等多种网络流协议。Shotcut 以其易用性、丰富的功能、广泛的格式支持以及可定制的工作流,成为自媒体新手入门和普通用户进行日常视频编辑的理想选择,同时也能满足一些对视频编辑有一定要求,但又不想使用过于复杂专业软件的用户的需求。
715
5
11
Awesome DeepSeek Integrations是DeepSeek 生态的开源集成宝库,汇集了与 DeepSeek AI 模型(如 DeepSeek-V3、R1、Coder 等)无缝集成的工具和应用,覆盖代码助手、翻译、知识管理等多种场景,支持多语言和多种开发平台。作为一站式集成资源库,是连接开发者、研究人员以及企业与 DeepSeek 生态系统的桥梁,降低了AI 技术开发门槛,加速 AI 在各领域的落地应用。
740
3
9
Open-Chat-Video-Editor结合了ChatGPT技术,用户只需与AI对话,告知想要的视频内容,AI即可自动生成成片,能自动识别需求,生成搞笑、情感、商业宣传等不同类型的视频。适合想要高效、快速出片,不想在剪辑上花费太多时间,更注重视频创意的人群。项目地址:https://github.com/scutlihaoyu/open-chat-video-editor
970
4
1
chatbox是一个AI客户端应用和智能助手,支持GPT、Claude、Gemini等众多先进的AI模型和API,可在多种平台上使用。支持 Windows、Mac 和 Linux 操作系统,号称是桌面端的终极 AI 助手。不过,对于大多数用户,官方推荐使用闭源的 Chatbox 官方版,它完全免费、安装简单且支持更多最新功能。
1080
9
4
multi-agent-orchestrator是一个灵活且强大的框架,用于管理和协调多个AI智能体,处理复杂的对话,支持智能意图分类、双语言支持等功能。项目地址:https://github.com/awslabs/multi-agent-orchestrator一、基本功能 1. 多智能体协调与调度Multi - agent - orchestrator 能够对多个智能体进行有效的协调和调度。它可以根据任务的需求和各个智能体的能力、状态,合理分配任务给不同的智能体。例如,在一个物流配送场景中,框架可以根据各个配送智能体(如无人机、配送车)的位置、负载情况和行驶速度,将不同的订单分配给最合适的智能体进行配送。
1160
8
9
PDFMathTranslate基于AI技术的PDF文档处理工具,能完整保留排版并进行双语翻译,支持Google、DeepL等主流翻译服务,还提供了CLI、GUI和Docker的支持。一、功能数学公式精准识别:借助先进的 OCR(光学字符识别)技术,PDFMathTranslate 能够精准地识别 PDF 文档中的数学公式。无论是复杂的微积分公式,还是线性代数中的矩阵表达式,它都能准确无误地提取出来,为后续的翻译和处理奠定基础。这一功能对于数学、物理、工程等领域的学术文献和专业资料处理至关重要,解决了传统 OCR 技术在识别复杂数学符号和结构时容易出现的错误和遗漏问题。
1015
1
7
eliza是一个强大的多智能体模拟框架,使用TypeScript构建,可用于创建、部署和管理自主AI智能体,能让智能体跨多个平台互动并保持一致的个性和知识。项目地址:https://elizaos.github.io/eliza一、基本功能1.多平台部署与交互:可在Discord、Twitter、Telegram等多个平台构建和部署具有一致个性的自主AI智能体,支持语音、文本和媒体交互,能适应不同社交平台的交流形式,满足用户多样化的沟通需求。
647
2
10
Langflow是一个面向开发者的低代码工具网站,专注于多智能体人工智能、提示工程和检索增强生成(RAG)应用的开发,能帮助开发者轻松构建强大的AI智能体和工作流。以可视化方式搭建AI应用,通过拖放操作就能创建复杂的AI工作流,降低开发门槛,减少编写样板代码的工作量,让开发者把更多精力放在创新上。提供数百种预构建的流和组件,涵盖多种数据来源、模型和向量存储选项,包括OpenAI、HuggingFace等常见模型,以及Notion、Google Drive等数据源。若现有组件无法满足需求,还支持自定义组件开发。适用于提示工程、智能体构建和RAG应用开发。如能创建帮助开发者调试代码的聊天机器人,以及从大量文档中检索特定信息的RAG驱动聊天机器人。
964
8
0
TEN智能体是一款由TEN驱动的对话式语音人工智能体,集成了Deepseek、Gemini、OpenAI、实时通信(RTC)技术,以及像ESP32这样的硬件。它具备实时的人工智能能力,例如视觉、听觉和语音功能,并且完全兼容如Dify和Coze等平台。 一款由TEN驱动的对话型人工智能,集成了Gemini 2.0 Live、OpenAI Realtime、RTC等技术,具备实时的视觉、听觉和语音功能。采用检索增强生成(RAG)技术,能将检索到的外部知识与生成模型结合,利用本地文档提供更准确、详细的答案。
763
0
2
Computational Linguistics Annotation Mediator(CLAM)是一个计算语言学应用中介,能将自然语言处理(NLP)命令行应用程序快速透明地转换为RESTful Web服务,终端用户和自动化客户端都能与之交互。用户可上传输入文件,选择特定参数启动应用,并下载和查看应用输出,还能监控应用运行状态。
503
5
14
VGG Image Annotator (VIA)用于图像、视频和音频数据的标注,支持多种标注类型,如区域标注、关键点标注等,并且可以将标注结果以JSON等格式导出,方便与各种机器学习框架集成,具有良好的跨平台性和可扩展性。VIA由牛津大学的视觉几何组(VGG)开发。使用JavaScript、HTML和CSS实现。
654
9
12
2025年3月6日:Monica发布全球首款通用型AI智能体产品Manus,引发了全球AI领域的高度关注。在GAIA基准测试中创下新纪录,性能远超OpenAI的同类产品。其自主任务执行能力覆盖金融分析、教育课件生成、工业设计等场景,单任务平均调用5.3个专业工具,复杂项目首次完成率突破78%。Manus源自拉丁语“Mens et Manus”,意为“手脑并用”,强调将知识转化为实际行动的能力,体现了要把思想应用到现实中以产生有意义影响的理念。
948
9
11
SnowNLP主要用于中文文本处理的工具包,虽然不是专门的标注工具,但提供了一些基本的自然语言处理功能,如词性标注、情感分析等,可以辅助进行数据标注和分析,使用简单,对中文的支持较好。项目地址:https://github.com/isnowfy/snownlp一、基本功能1. 中文分词:将一段中文文本拆分成一个个独立的词语,例如把“我爱自然语言处理”分词为“我”“爱”“自然语言处理” ,方便后续的文本分析。
1052
1
6
Prodigy是一款功能强大的自然语言处理标注工具,提供了多种标注界面和任务类型,如文本分类、实体标注、关系标注等。它支持实时反馈和模型辅助标注,能够提高标注效率和质量,同时还具有数据管理和版本控制等功能,方便团队协作。项目地址:https://prodi.gy一、基本功能
1158
4
7
智能护颈枕作为融合人体工程学、传感技术、温控系统及理疗功能的高科技产品,其核心技术涵盖多个领域,旨在为用户提供科学的颈椎支撑与优质的睡眠体验。一、人体工程学设计与力学优化1. 颈椎曲度适配性设计 智能护颈枕基于人体颈椎的自然生理曲度进行精密建模,通常采用“中间低、两侧高”的弧形结构,以确保在睡眠过程中对颈椎提供精准的支撑力。这种设计能够有效维持颈椎的中立位,减少因不良睡姿导致的椎间盘压力和肌肉张力,从而预防慢性劳损的发生。
1061
5
5
文本标注是自然语言处理领域中的一项基础且关键的任务,它主要是指专业的标注人员或借助特定的标注工具,按照一定的规则和标准,对文本内容进行标记和注释,从而赋予文本特定的语义信息和结构信息。具体来说,标注人员会根据任务需求,在文本中识别并标记出各种元素,比如将文本中的人名、地名、组织机构名等标注为不同的实体类型,确定文本中不同实体之间存在的关系,像因果关系、所属关系等,还会对文本中的特定事件进行标注,记录事件的类型、发生时间、参与主体等信息,同时可能会标注出文本的情感倾向,如积极、消极或中性等。通过文本标注,可以将非结构化的文本数据转化为结构化的数据,为自然语言处理中的命名实体识别、关系抽取、情感分析、信息检索、机器翻译等各种任务提供基础数据支持,帮助计算机更好地理解和处理文本信息,进而推动自然语言处理技术的发展和应用。
684
9
2
图像标注在多个领域有着广泛应用。在计算机视觉研究方面,它为各种计算机视觉算法的训练和评估提供数据支持,助力研究人员开发更先进的图像识别与理解算法;在自动驾驶领域,通过标注道路场景图像中的车辆、行人、交通标志、车道线等,让自动驾驶系统得以准确感知周围环境并做出决策;安防监控中,对监控视频里的人物、物体等进行标注,能够实现行为分析、目标追踪等功能,提升安防监控的智能化水平;医疗影像分析时,标注医学影像中的病变区域、器官等,可辅助医生进行疾病诊断与分析,提高诊断的准确性和效率。
601
1
6
止鼾枕是一种旨在帮助减轻或防止打鼾的睡眠辅助工具,其技术原理主要包括以下几个方面:1.调整睡眠姿势 原理:很多人打鼾是由于睡眠时仰卧,舌根后坠堵塞气道导致。止鼾枕通过特殊的形状设计和支撑结构,引导使用者在睡眠中保持侧卧姿势,减少仰卧时间。侧卧时,舌根受重力作用会向一侧偏移,可在一定程度上避免气道被完全堵塞,使呼吸更加顺畅,从而减轻或防止打鼾。
521
1
9
1. 引言随着人工智能技术的快速发展,大型语言模型(LLM, Large Language Models)在自然语言处理、知识问答、内容生成等领域展现出强大的能力。然而,由于隐私保护、数据安全以及特定领域需求等原因,越来越多的企业和组织选择将LLM部署到本地环境中。与此同时,结合本地知识库的应用能够显著提升LLM在特定场景中的表现。
506
7
11
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 (深数据® DEEPDATA® 极深®) 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号