登录
主页
 文章
Video Analyst由Megvii Detection团队开发,涵盖了单目标跟踪(SOT)和视频目标分割(VOS)等基础算法,为视频理解提供了一系列实用的基础算法实现。基于PyTorch构建的深度学习平台,专注于视频数据的处理、分析和理解,为开发者、研究者以及企业提供高效、精准的视频理解解决方案。
842
6
9
Apache SINGA是一个由Apache软件基金会管理的开源分布式深度学习平台,它支持多种深度学习模型和算法。SINGA最初由新加坡国立大学的数据库系统组与浙江大学的数据库组合作开发,于2014年启动,并在2015年10月8日发布了首个版本,2015年3月其原型被Apache孵化器接受。SINGA的安装较为方便,用户可以使用Conda、Pip、Docker等工具进行安装,也可以从源代码进行安装。
868
0
10
FreeCAD是一个基于OpenCASCADE的开源CAD/CAE工具,可运行于Windows、Linux以及macOS系统环境下。它是一种通用的3D CAD建模软件,采用GPL和LGPL许可证开源。FreeCAD配备了现代化的3D CAD建模功能和许多2D元件,可用于绘制2D形状、提取三维模型的设计细节以创建2D生产图纸等,适用于机械工程、建筑及其他工程专业等广泛领域,并且具有类似CATIA、SolidWorks或Solid Edge的工具,能够提供CAX(CAD、CAM、CAE)、PLM等功能。
1008
4
2
PySyft是一个由OpenMined组织开发的一个开源Python库,用于安全和私密的深度学习。它允许研究人员和开发人员在不泄露数据的情况下训练和使用深度学习模型。PySyft的核心目标是实现安全和私密的深度学习,其核心理念是“在数据所在的地方进行数据科学”,即允许数据科学家和研究人员在不直接访问原始数据的情况下对数据进行分析和建模,从而保护数据隐私,也为跨组织的数据协作提供了可能。
808
0
12
H2O是一个开源的深度学习平台,它提供了深度学习算法,支持CPU和GPU平台的单线程和多线程模式。H2O平台的性能测试表明,选择合适的参数对于优化机器学习方法,尤其是图像识别问题至关重要。H2O由H2O.ai(前身为Oxdata)于2011年在硅谷推出,旨在为大数据分析提供高效的开源软件解决方案,使用户能够快速处理和分析大量数据,发现数据中的模式和规律。
902
3
0
Light-LPR可在嵌入式设备、手机端和普通的x86平台上运行的车牌识别开源项目,车牌字符识别准确率超99.95%,综合识别准确率超过99%,支持目前国内所有的车牌识别。采用MTCNN检测车牌和四个角点精确定位,并进行偏斜纠正,最后进行端到端识别车牌号码,使用MNN作为推理引擎。
891
9
14
MMAction2由OpenMMLab推出的基于PyTorch的开源工具箱,是视频理解领域的一站式解决方案。专注于动作识别、动作定位、时空行为检测、基于骨骼的动作识别以及视频检索五大关键视频理解任务。采用模块化设计,可灵活构建定制化的视频理解框架。提供了详细的文档和API参考,方便用户学习和使用,且配备了单元测试,代码质量有保障。
1174
2
5
在图片上创建水印(watermark.js)watermark.js是一个 JavaScript 库,用于在图片上创建水印。能自动为指定类名的图片添加自定义水印,支持四种水印位置选择,还可自定义水印样式,包括水印图片路径、透明度等,且基于纯 JavaScript 编写,兼容大多数现代浏览器。一、概述watermark.js是一个用于在图片上添加水印的JavaScript库。它提供了一种方便的方式来保护图片版权或者为图片添加标识信息。
772
3
7
GraphCodeBERT是在CodeBERT的基础上进一步改进的模型,它引入了图神经网络(Graph Neural Network,GNN)来更好地处理代码的结构信息。代码的语法和语义结构可以自然地表示为图结构,例如抽象语法树(Abstract Syntax Tree,AST)。GraphCodeBERT通过GNN对代码的图结构进行建模,能够更深入地理解代码的逻辑和上下文关系,从而在代码理解和生成任务中取得更好的性能。
752
9
13
awesome defect detection汇集多种表面缺陷检测方法的仓库,它包括了学术论文、开源工具、算法汇总以及数据集等。包含基于深度学习的语义分割、目标检测以及对抗性网络(GAN)等技术,还关注了 PCB 电路板、钢材、胶囊、电池、织物和水果蔬菜等特定行业的应用。语义分割可像素级确定缺陷区域,目标检测能定位图像中异常部分,基于 GAN 的方法提升识别准确性,且提供的代码库可直接用于实际项目开发。
754
4
14
Blind_watermark项目利用先进的图像处理和机器学习技术,在不影响原图视觉效果的前提下,为图片添加难以察觉的 “盲水印”。其核心在于创新的水印嵌入和提取算法,包括数据预处理、频域编码、深度学习模型等,并且具有良好的鲁棒性,对常见的图像处理有抵抗能力,不容易被移除。
532
1
12
HyperLPR是一个高性能中文车牌识别框架,识别速度快,在720p分辨率下,单核Intel 2.2GHz CPU平均识别时间不到100ms;准确率高,在出入口场景下,准确率可达95%97%;支持多种车牌类型,包括单行蓝牌、单行黄牌、新能源车牌、教练车牌等,还可有限支持白色警用车牌、使馆/港澳车牌、双层黄牌、武警车牌等;跨平台支持,可在Windows、Linux、MacOS、Android等多个平台上运行;采用端到端识别,无需字符分割,直接输出识别结果。
812
1
6
Thumbor是一个开源的 Python 图片处理服务,主要用于对图像进行裁剪、缩放、旋转、模糊等操作,并提供高性能和可扩展性的特点。Thumbor 通过简单的 HTTP API 对图像进行处理,支持多种图片处理操作,并且具有高性能和低延迟的特点,适用于处理大量的图片请求‌。一、功能
884
8
11
Cascade CNN由一系列级联的卷积神经网络组成,每个网络都对前一个网络的输出进行进一步的细化和优化。通过逐步提高检测的精度和准确性,最终得到准确的人脸检测结果。Cascade CNN可以有效地提高人脸检测的准确率,对于复杂背景和多样化的人脸姿态具有较好的适应性。一、基本概念
504
0
0
RetinaFace 是一种先进的单阶段多任务卷积神经网络人脸检测模型,采用多阶段的检测策略,结合了特征金字塔网络(FPN)和自注意力机制等技术。通过不同层次的特征图来检测不同大小的人脸,同时利用自注意力机制增强对人脸关键特征的关注。在复杂场景下,如光照变化、姿态多样、遮挡等情况下,仍能保持较高的检测准确率,对人脸的特征提取更加精细。
1126
4
8
PLBART是一种基于Transformer架构的预训练模型,专门用于处理编程语言相关的任务。它在多种编程语言的代码和自然语言文本上进行了联合预训练,能够将代码和自然语言进行有效的融合和转换。PLBART可以用于代码生成、代码修复、代码摘要、代码问答等任务,通过对代码和自然语言的联合学习,能够更好地理解开发人员的意图,生成更符合需求的代码。
751
4
14
CodeT5是由Salesforce研究团队开发的一种开源的预训练代码生成模型,它基于T5架构,并在大规模的代码数据集上进行了预训练。CodeT5能够将代码的输入转换为相应的输出,例如根据函数的签名生成函数体、根据代码片段生成完整的代码等。它在代码生成任务中表现出色,能够生成高质量、符合语法和逻辑的代码。CodeT5在多种代码相关任务上取得了先进的性能表现,如代码生成、代码补全、文本到代码检索等任务。经过指令调整的CodeT5+ 16b在HumanEval代码生成任务中取得了35.0%的一次通过率和54.5%的十次通过率,超过了许多其他开放代码语言模型以及闭源的OpenAI codecushman001模型。
918
6
6
CVCUDA是一个开源的、GPU加速的图像处理和计算机视觉库,由NVIDIA和字节跳动的机器学习团队联合开发。它支持batch操作,可以充分利用GPU的并行加速特性,提升计算效率和吞吐率。一、特点1.支持batch操作:能够充分利用GPU高并发、高吞吐的并行加速特性,提升计算效率和吞吐率,可让开发者一次性处理多个图像,提高处理速度,适用于大规模图像数据的批量处理。
743
3
7
CodeBERT由微软和清华大学2020年共同开发,是一种预训练的语言模型,在大规模的代码数据上进行了预训练,能够理解和生成代码。它可以用于多种软件开发任务,如代码补全、代码生成、代码翻译、代码摘要等。通过对大量不同编程语言的代码进行学习,CodeBERT能够捕捉代码中的语义和结构信息,从而为开发人员提供更准确、更有用的代码建议和生成结果。
876
2
6
Multi Task Cascaded Convolutional Networks(MTCNN)是一种多任务的级联卷积神经网络,它同时处理人脸检测、面部关键点定位和人脸姿态估计三个任务。由于MTCNN在人脸检测和面部关键点定位方面的高精度和较好的性能,它被广泛应用于各种需要人脸处理的应用中,如人脸识别门禁系统、社交平台的人脸特效(如添加滤镜、美颜等)、视频会议软件中的人脸跟踪等。在直播软件中,MTCNN可以实时检测主播的人脸,为后续的美颜、特效添加等操作提供基础。
977
3
7
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号