登录
主页
 文章
H2O是一个开源的深度学习平台,它提供了深度学习算法,支持CPU和GPU平台的单线程和多线程模式。H2O平台的性能测试表明,选择合适的参数对于优化机器学习方法,尤其是图像识别问题至关重要。H2O由H2O.ai(前身为Oxdata)于2011年在硅谷推出,旨在为大数据分析提供高效的开源软件解决方案,使用户能够快速处理和分析大量数据,发现数据中的模式和规律。
526
3
6
Light-LPR可在嵌入式设备、手机端和普通的x86平台上运行的车牌识别开源项目,车牌字符识别准确率超99.95%,综合识别准确率超过99%,支持目前国内所有的车牌识别。采用MTCNN检测车牌和四个角点精确定位,并进行偏斜纠正,最后进行端到端识别车牌号码,使用MNN作为推理引擎。
609
9
5
MMAction2由OpenMMLab推出的基于PyTorch的开源工具箱,是视频理解领域的一站式解决方案。专注于动作识别、动作定位、时空行为检测、基于骨骼的动作识别以及视频检索五大关键视频理解任务。采用模块化设计,可灵活构建定制化的视频理解框架。提供了详细的文档和API参考,方便用户学习和使用,且配备了单元测试,代码质量有保障。
901
1
14
在图片上创建水印(watermark.js)watermark.js是一个 JavaScript 库,用于在图片上创建水印。能自动为指定类名的图片添加自定义水印,支持四种水印位置选择,还可自定义水印样式,包括水印图片路径、透明度等,且基于纯 JavaScript 编写,兼容大多数现代浏览器。一、概述watermark.js是一个用于在图片上添加水印的JavaScript库。它提供了一种方便的方式来保护图片版权或者为图片添加标识信息。
636
6
11
GraphCodeBERT是在CodeBERT的基础上进一步改进的模型,它引入了图神经网络(Graph Neural Network,GNN)来更好地处理代码的结构信息。代码的语法和语义结构可以自然地表示为图结构,例如抽象语法树(Abstract Syntax Tree,AST)。GraphCodeBERT通过GNN对代码的图结构进行建模,能够更深入地理解代码的逻辑和上下文关系,从而在代码理解和生成任务中取得更好的性能。
1065
1
1
awesome defect detection汇集多种表面缺陷检测方法的仓库,它包括了学术论文、开源工具、算法汇总以及数据集等。包含基于深度学习的语义分割、目标检测以及对抗性网络(GAN)等技术,还关注了 PCB 电路板、钢材、胶囊、电池、织物和水果蔬菜等特定行业的应用。语义分割可像素级确定缺陷区域,目标检测能定位图像中异常部分,基于 GAN 的方法提升识别准确性,且提供的代码库可直接用于实际项目开发。
1063
7
4
Blind_watermark项目利用先进的图像处理和机器学习技术,在不影响原图视觉效果的前提下,为图片添加难以察觉的 “盲水印”。其核心在于创新的水印嵌入和提取算法,包括数据预处理、频域编码、深度学习模型等,并且具有良好的鲁棒性,对常见的图像处理有抵抗能力,不容易被移除。
1065
6
0
HyperLPR是一个高性能中文车牌识别框架,识别速度快,在720p分辨率下,单核Intel 2.2GHz CPU平均识别时间不到100ms;准确率高,在出入口场景下,准确率可达95%97%;支持多种车牌类型,包括单行蓝牌、单行黄牌、新能源车牌、教练车牌等,还可有限支持白色警用车牌、使馆/港澳车牌、双层黄牌、武警车牌等;跨平台支持,可在Windows、Linux、MacOS、Android等多个平台上运行;采用端到端识别,无需字符分割,直接输出识别结果。
830
7
2
Thumbor是一个开源的 Python 图片处理服务,主要用于对图像进行裁剪、缩放、旋转、模糊等操作,并提供高性能和可扩展性的特点。Thumbor 通过简单的 HTTP API 对图像进行处理,支持多种图片处理操作,并且具有高性能和低延迟的特点,适用于处理大量的图片请求‌。一、功能
976
5
13
Cascade CNN由一系列级联的卷积神经网络组成,每个网络都对前一个网络的输出进行进一步的细化和优化。通过逐步提高检测的精度和准确性,最终得到准确的人脸检测结果。Cascade CNN可以有效地提高人脸检测的准确率,对于复杂背景和多样化的人脸姿态具有较好的适应性。一、基本概念
743
3
11
RetinaFace 是一种先进的单阶段多任务卷积神经网络人脸检测模型,采用多阶段的检测策略,结合了特征金字塔网络(FPN)和自注意力机制等技术。通过不同层次的特征图来检测不同大小的人脸,同时利用自注意力机制增强对人脸关键特征的关注。在复杂场景下,如光照变化、姿态多样、遮挡等情况下,仍能保持较高的检测准确率,对人脸的特征提取更加精细。
541
0
13
PLBART是一种基于Transformer架构的预训练模型,专门用于处理编程语言相关的任务。它在多种编程语言的代码和自然语言文本上进行了联合预训练,能够将代码和自然语言进行有效的融合和转换。PLBART可以用于代码生成、代码修复、代码摘要、代码问答等任务,通过对代码和自然语言的联合学习,能够更好地理解开发人员的意图,生成更符合需求的代码。
646
4
9
CodeT5是由Salesforce研究团队开发的一种开源的预训练代码生成模型,它基于T5架构,并在大规模的代码数据集上进行了预训练。CodeT5能够将代码的输入转换为相应的输出,例如根据函数的签名生成函数体、根据代码片段生成完整的代码等。它在代码生成任务中表现出色,能够生成高质量、符合语法和逻辑的代码。CodeT5在多种代码相关任务上取得了先进的性能表现,如代码生成、代码补全、文本到代码检索等任务。经过指令调整的CodeT5+ 16b在HumanEval代码生成任务中取得了35.0%的一次通过率和54.5%的十次通过率,超过了许多其他开放代码语言模型以及闭源的OpenAI codecushman001模型。
1125
7
13
CVCUDA是一个开源的、GPU加速的图像处理和计算机视觉库,由NVIDIA和字节跳动的机器学习团队联合开发。它支持batch操作,可以充分利用GPU的并行加速特性,提升计算效率和吞吐率。一、特点1.支持batch操作:能够充分利用GPU高并发、高吞吐的并行加速特性,提升计算效率和吞吐率,可让开发者一次性处理多个图像,提高处理速度,适用于大规模图像数据的批量处理。
1076
3
6
CodeBERT由微软和清华大学2020年共同开发,是一种预训练的语言模型,在大规模的代码数据上进行了预训练,能够理解和生成代码。它可以用于多种软件开发任务,如代码补全、代码生成、代码翻译、代码摘要等。通过对大量不同编程语言的代码进行学习,CodeBERT能够捕捉代码中的语义和结构信息,从而为开发人员提供更准确、更有用的代码建议和生成结果。
947
5
13
Multi Task Cascaded Convolutional Networks(MTCNN)是一种多任务的级联卷积神经网络,它同时处理人脸检测、面部关键点定位和人脸姿态估计三个任务。由于MTCNN在人脸检测和面部关键点定位方面的高精度和较好的性能,它被广泛应用于各种需要人脸处理的应用中,如人脸识别门禁系统、社交平台的人脸特效(如添加滤镜、美颜等)、视频会议软件中的人脸跟踪等。在直播软件中,MTCNN可以实时检测主播的人脸,为后续的美颜、特效添加等操作提供基础。
557
3
8
OpenNE是一个网络表示学习工具包,提供了标准化的网络表示学习训练和测试框架,基于TensorFlow实现了DeepWalk、LINE、node2vec等代表网络表示学习模型,并可以对结果进行分类评测和可视化分析。OpenNE是由清华大学自然语言处理实验室(THUNLP)开发的开源网络嵌入工具包,提供一个统一且标准化的训练和测试平台,帮助研究人员和开发者更好地理解和挖掘大规模网络数据中的潜在关系,以进行网络表示学习。
910
4
9
ArcFace核心是通过多层卷积和池化操作提取人脸图像的特征,然后将特征向量进行归一化和角度度量。在训练时使用大量的人脸图像和对应的标签,通过反向传播算法优化网络参数。通过对人脸特征进行归一化处理,使得特征向量具有更好的可比性和稳定性,从而提高了人脸识别的准确率。采用余弦相似度度量方法,比传统的欧式距离度量更能准确地衡量特征向量之间的相似度。
659
9
0
AI眼镜是一种融合了人工智能技术的智能穿戴设备。特点● 轻巧舒适:AI眼镜在设计上追求与传统眼镜相似的外观,确保长时间佩戴也不会感到不适。比如雷鸟创新携手博士眼镜共同打造的新一代AI眼镜,在保证功能性的同时,也注重了佩戴者的舒适体验,即使镜腿略宽,但整体依然保持了良好的佩戴感。
733
8
0
Dataiku是一个端到端的AI平台,它简化了深度学习的工作流程,包括图像分类和对象检测。Dataiku提供了无代码工具来实现图像分类或对象检测工作流程的核心领域,并支持模型的培训、解释、部署等。一、功能特点1.数据准备与处理:提供可视化和编码两种方式来进行大规模的数据连接、清洗和准备工作,帮助企业快速整合和预处理数据,减少数据准备时间,提高数据质量,为后续的分析和建模奠定基础。
790
9
7
- -
© 2021 - 现在 杭州极深数据有限公司 版权所有 (深数据® DEEPDATA® 极深®) 联系我们 
浙公网安备 33018302001059号  浙ICP备18026513号-1号