登录
主页
 文章
随着深度学习技术的快速发展,大规模语言模型(LLMs)、多模态模型和生成式AI模型等大模型在自然语言处理、计算机视觉、语音识别等领域展现出强大的性能。然而,大模型的应用不仅仅是简单的模型训练和推理,它涉及复杂的工程化流程,包括数据预处理、分布式训练、模型优化、部署和监控等多个环节。
986
9
12
随着人工智能(AI)技术的快速发展,生成式人工智能(Generative AI,简称GenAI)逐渐成为推动产品创新的核心驱动力之一。GenAI通过深度学习模型(如GPT、DALL·E等),能够生成高质量的文字、图像、音频和视频内容,为多个行业提供了前所未有的创新机会。1. GenAI技术概述GenAI是一种基于深度学习的人工智能技术,专注于生成内容而非简单地分类或预测。其核心技术包括:
783
7
6
智能代理(Intelligent Agents)作为计算机科学与人工智能领域中熠熠生辉的重要研究方向,逐渐崭露头角,吸引了众多研究者与开发者的目光。智能代理本质上是一类极为特殊的自主系统,它们仿佛拥有“智慧的大脑”与“敏锐的感知力”,不仅能够精准地感知所处的环境,还能依据感知到的信息,通过复杂且精妙的内部逻辑,迅速做出合理决策,并果断采取行动。其应用范围之广泛,犹如一张无形却庞大的网络,从最基础、简单的任务自动化场景,如日常办公中的文件自动分类整理,到极为复杂、充满挑战的多智能体协作领域,诸如大型智能交通系统中众多交通工具的协同调度,无不留下智能代理的身影。本文将如同一束明亮的探照灯,穿透智能代理领域的重重迷雾,深入且全面地探讨其定义、特性、分类、应用以及技术实现等关键方面,并对其在发展进程中所面临的挑战进行剖析,同时大胆展望未来的发展方向,为读者勾勒出一幅完整而清晰的智能代理知识画卷。
540
1
4
在数字化时代浪潮的推动下,自然语言处理(NLP)领域正经历着前所未有的变革,其中大语言模型(Large Language Models, LLMs)无疑是最为耀眼的明星。近年来,大语言模型取得了令人瞩目的显著进展,宛如一颗在技术苍穹中冉冉升起的新星,迅速照亮了自然语言处理的诸多应用场景。这些模型展现出了令人惊叹的能力,它们能够生成逻辑连贯、语法正确且富有语义内涵的高质量文本,无论是撰写新闻报道、创作故事小说,还是生成专业领域的文档,都能应对自如;在对话场景中,它们能进行复杂且流畅的交互,理解用户的意图,提供准确而恰当的回应,宛如一位知识渊博、沟通无碍的交流伙伴;在语言翻译方面,大语言模型跨越了不同语言之间的壁垒,实现了多种语言之间的精准转换,极大地促进了全球范围内的信息交流与文化传播。更为惊人的是,在诸多自然语言处理任务中,大语言模型的表现已经接近甚至在某些特定方面超越了人类水平,这一突破性的进展引发了学术界、产业界乃至全社会的广泛关注与深入探讨。
743
7
10
1. 引言在数字化浪潮的推动下,物联网(IoT)设备数量呈现出爆发式增长态势。传统云计算架构在应对海量 IoT 设备所产生的数据时,逐渐暴露出数据传输延迟高、带宽消耗大以及隐私保护困难等问题。边缘计算作为一种创新型计算模式,通过将部分计算任务从云端下沉至靠近数据源的网络边缘节点,有效缓解了这些难题。这一模式显著降低了数据传输延迟,大幅提升了系统响应速度,同时强化了数据隐私保护能力。然而,面对市场上琳琅满目的边缘计算框架,如何精准挑选出与企业业务需求及技术条件相匹配的框架,已成为企业构建边缘计算解决方案时所面临的核心挑战。本指南旨在为开发者和企业提供全面、详尽的边缘计算框架选型建议,助力其做出最优决策。
1120
7
3
OpenAuth.Net基于.NET Core/.NET 5的开源权限工作流快速开发框架,汲取了Martin Fowler企业级应用开发思想,集成了IdentityServer、EF Core、Quartz、AutoFac、WebAPI、Swagger等技术。提供强大的自定义权限控制功能,支持完整的字段权限控制,还支持可拖拽的表单设计、可视化流程设计、基于Quartz.Net的定时任务控制等功能,适合中小企业快速开发权限工作流应用,支持多租户和OAuth2登录体系,便于构建分布式应用。
553
9
8
GNU 图像处理程序,通常被称为 GIMP,是一款免费的开源光栅图形编辑器,用于图像修饰、照片编辑和平面设计。GIMP最初由Peter Mattis、Spencer Kimball和若干志愿者于1995年开始开发。当时,他们希望创建一个功能强大且自由的图像编辑工具,以替代当时一些商业软件的局限性。1996年,GIMP 0.54版本发布,标志着该项目的初步成型,它已经具备了一些基本的图像编辑功能,如选区、画笔、图层等。
947
0
1
项目的人脸识别是基于业内领先的C++开源库 dlib中的深度学习模型,用Labeled Faces in the Wild人脸数据集进行测试,有高达99.38%的准确率。但对小孩和亚洲人脸的识别准确率尚待提升。提供了简单易用的 API,可用于人脸检测、人脸识别和人脸编码等任务。即使没有深厚的机器学习背景,也能借助这个项目快速实现人脸识别相关的功能。
842
6
12
FaceNet是谷歌公司于2015年提出的一种用于人脸识别的开源计算机视觉模型。其核心是基于深度学习的卷积神经网络(CNN),能够将人脸图像映射到一个固定维度的向量(嵌入向量或特征向量)上,以此保留人脸图像的主要特征。通过比较两个人脸图像的嵌入向量,就可以判断它们是否属于同一个人,具有较高的准确性。
917
6
3
InsightFace是基于PyTorch和MXNet的开源2D/3D深度人脸识别分析工具,由旷视研究院开发并维护。它集成了众多先进的人脸识别算法和模型,为研究人员和开发者提供了强大且易于使用的工具,可用于多种人脸识别相关的任务。项目地址:https://github.com/deepinsight/insightface一、主要特点
504
8
14
随着科技的发展,许多行业对面部识别和分析技术的需求日益增长。例如,人机交互领域需要更自然、直观的交互方式,市场研究领域希望通过分析消费者的面部表情来评估广告效果和产品设计,安防领域也需要高精度的人脸识别技术来保障安全等。然而,现有的商业解决方案往往成本较高,且定制化程度有限,难以满足不同行业的多样化需求。
712
0
6
Apache Sentry最初由Cloudera公司内部开发,针对Hadoop系统中的数据(主要是HDFS、Hive的数据)进行细粒度控制,对HDFS、Hive以及Impala有着良好的支持性。2013年Sentry 成为 Apache 的孵化项目,为 Hadoop 集群元数据和数据存储提供集中、细粒度的访问控制。其架构包括DataEngine、Plugin、Policy metadata等部分,Plugin负责和Sentry Server通信以同步权限策略信息,并包含认证引擎模块进行权限验证,Sentry Server中还有audit模块记录请求访问记录。
950
8
2
DataPermissionHelper是一个强大的数据权限控制框架,基于策略模式设计,允许开发者根据业务需求定义不同的权限策略。支持主流的ORM框架,如Entity Framework、Nhibernate等,通过注解驱动,能在模型类或属性上添加注解标记需要进行权限控制的部分,适用于各类Web应用程序,尤其对数据敏感的应用场景,具有高定制化、低侵入性和易用性强等特点。
529
7
11
Haystack是一个端到端的 NLP 框架,专门用于构建基于文档的问答系统,是实现 RAG 的理想选择。它提供了数据预处理、文档存储、检索和生成等一系列组件,支持多种语言模型和检索器。提供可视化界面,方便用户进行配置和调试;支持多模态数据,可处理文本、图像等多种类型的数据;具有可扩展性,可根据需求添加自定义组件。
688
9
14
2022年为解决大语言模型与外部知识结合的难题,创始人意识到需开发一个工具让开发者能便捷地将自定义数据集成到语言模型应用中。积极与其他开源项目和工具集成,如与 LangChain 等框架结合,发挥各自优势,为开发者提供更强大的开发体验。LlamaIndex专注于数据框架,可帮助用户轻松地将自定义数据集成到语言模型中,实现 RAG 应用。它提供了多种数据连接器和索引结构,能高效地检索相关信息并结合大语言模型生成答案。支持多种数据源,包括文件、API、数据库等;提供多种索引类型,如向量索引、树索引等,可根据不同场景选择合适的索引;具有简单易用的 API,能快速构建 RAG 应用。
906
9
11
编程大模型是基于深度学习技术、用于处理编程任务的大规模语言模型。其特点为参数规模庞大,经海量编程数据训练,多采用Transformer架构以自动提取代码语义和结构信息。它具备诸多功能,能依自然语言描述或任务需求生成代码,理解解释既有代码,在开发者编写时自动补全代码片段,实现不同编程语言间代码翻译,还能检测纠错并优化代码。这类模型通过学习开源代码库、技术文档等大量编程语料掌握编程知识,可应用于软件开发、代码教育等领域,助力提升编程效率、降低成本和提高代码质量 。
1134
1
3
Langchain用于开发由大型语言模型驱动的应用程序的框架,简化了 LLM 应用程序生命周期的每个阶段,包括开发、生产化和部署。由 langchain - core、langchain - community、合作伙伴包、langchain、langgraph、langserve、langsmith 等开源库组成,提供了各种构建块、组件和第三方集成,帮助开发者构建应用程序,还支持状态代理、流媒体、人在回路等功能,以及对应用程序进行调试、测试、评估和监控。Langchain由 Harrison Chase 创立,早期专注于提供工具和组件,帮助开发者更轻松地与语言模型进行交互。目前在自然语言处理和AI应用开发领域获得了广泛的认可和应用。
804
9
8
CodeArena基于 Together AI、Sandpack、Next.js、TypeScript 等技术构建,用于测试不同开源 LLM 的编程能力,实时更新排行榜。功能特点:支持多个 LLM 同时解决相同编程问题,用户可实时观察代码生成过程和结果;根据 LLM 解决问题的效率、准确性和代码质量等因素进行排名;用户可比较不同 LLM 生成代码的可读性、效率和错误率等;集成了代码编辑器和调试工具等开发者工具。
1145
9
11
Ollama Deep Researcher是一个基于本地的网络调研和报告撰写助手,利用Ollama托管的本地大型语言模型(LLM),为用户提供高效、隐私保护的调研服务,帮助用户快速生成特定主题的高质量研究总结。项目地址:https://github.com/langchain-ai/ollama-deep-researcher一、核心功能1.智能调研流程:输入主题后,它会自动生成搜索查询,调用搜索引擎获取结果,用LLM总结内容,反思总结以发现知识空白,再生成新查询填补空白,按用户设定的次数迭代,不断优化总结。
841
3
3
Improvado专注于营销数据提取和聚合的平台,可从200多个营销和广告平台自动提取数据,进行定制化映射和转换,集成数据仓库和BI工具,提供预构建仪表盘模板。适用于整合多平台营销数据做统一报告、分析跨渠道营销效果等场景。优点是专业性强,支持平台多,功能可定制;缺点是主要针对营销数据,价格相对较高。
627
1
6
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号