登录
主页
文章
什么是信息指纹?
信息指纹,也常被称为数据指纹、数字指纹或内容哈希,是一种用于确保信息完整性和唯一性的技术方法。它的工作原理是对原始数据(如文本、图像、音频或视频文件)进行特定算法处理,产生一个固定长度的、独特的数值或字符串。这个输出值就是所谓的“指纹”。一、数据指纹的特点
2024-07-29
821
9
6
期望最大化算法(Expectation-Maximization Algorithm, EM Algorithm)
期望最大化算法,简称EM算法,是一种在统计学中用于迭代地找到概率模型中未观测变量(隐变量)的估计值的算法,同时对模型参数进行最大似然估计或最大后验概率估计。它特别适用于处理具有缺失数据或者隐含变量的概率模型问题,如混合高斯模型、隐马尔可夫模型等。
2024-07-28
766
5
5
最大熵模型(Maximum Entropy Model,MaxEnt)
最大熵模型(Maximum Entropy Model,MaxEnt)是一种基于信息论原理的统计建模方法,广泛应用于自然语言处理、机器学习、数据挖掘等多个领域。该模型由E.T. Jaynes于20世纪50年代提出,其核心思想是在满足已知事实或约束条件下,选择具有最大熵的概率分布作为模型。熵是不确定性或信息量的度量,最大熵模型因此寻求最不确定的模型,即在给定的信息下尽可能不做额外假设。
2024-07-28
916
6
6
维特比算法(Viterbi Algorithm)
维特比算法(Viterbi Algorithm),由安德鲁·维特比(Andrew Viterbi)于1967年提出,是一种用于寻找最有可能产生观测序列的隐藏状态序列的动态规划算法。它在信息论、编码理论、语音识别、生物信息学等领域有着广泛的应用,特别适用于信号处理和自然语言处理等领域,用于从一系列观察到的事件中推断出最可能的产生这些事件的状态序列。
2024-07-27
1004
2
14
时间盒(Timeboxing)
Timeboxing(时间盒)是一种时间管理方法它指的是为特定的任务或活动分配固定的、预先确定的时间区间。通过设定明确的时间限制,促使人们专注于任务,减少拖延和分心,从而在有限的时间内完成更多工作。例如,规定自己在 30 分钟内完成一份报告的初稿。有助于更好地规划一天或一周的工作安排,确保各项任务都能得到合理的时间分配。比如,为每个会议安排一个小时的时间盒,避免会议过长或过短。
2024-07-27
625
2
9
数据质量管理需要数据责任人
在数据质量管理中,数据责任人机制是一项非常重要的策略和管理手段。在数据质量管理中,涉及众多的流程和环节,如数据收集、存储、处理、分析和使用等。明确数据责任人能够清晰地界定每个环节的责任归属,避免出现职责不清、推诿责任的情况。例如,在数据收集阶段,数据责任人要确保收集的数据准确、完整且符合合规要求。
2024-07-27
934
3
14
如何开展数据质量管理?
数据质量问题应该说是伴随我们的日常工作,只不过我们都是熟视无睹罢了。一、典型数据质量问题1. 数据不准确: - 数据录入错误,例如人工输入时的拼写错误、数据混淆或误填。 - 数据源本身存在错误或偏差,导致后续数据不准确。例如,传感器故障导致收集的物理数据错误。
2024-07-26
525
6
14
元数据在数据治理中的作用
在数据治理中,元数据(Metadata)扮演着至关重要的角色。它被定义为“关于数据的数据”,主要分为技术元数据和业务元数据两大类。技术元数据关注数据仓库的系统细节,如字段、分区等信息,而业务元数据则关注业务词汇表、数据元素和实体的定义、业务规则和算法以及数据特征 。
2024-07-25
527
7
13
《数据资产化实践指南》解析
由广东省政务服务和数据管理局指导,广东数字政府研究院、广州数据交易所、粤港数据安全与隐私保护联合实验室、广州芳禾数据有限公司等单位联合编制的《数据资产化实践指南》(以下简称为《实践指南》)发布,以数据产生的业务源头到数据实现资产化的全流程入手,按照“业务数据化-数据资源化-数据产品化-数据资本化”的演变方式,探索建立数据资产化的可行路径为企业数据资产化提供了全面的指导。
2024-07-25
1078
4
14
知识图谱如何应用于单位内部审计?
知识图谱(Knowledge Graph)是一种用图结构来表示知识和信息的技术。它将实体(如人、地点、事件、概念等)作为节点,实体之间的关系作为边,从而构建起一个大规模的语义网络。通过这种方式,知识图谱能够清晰地展示出不同实体之间的关联和相互作用。知识图谱能够更好地理解和表达知识的语义,不仅仅是简单的关键词匹配。将来自多个数据源、多种类型的知识整合在一起,形成一个统一的知识框架。强调实体之间的关系,有助于发现隐藏的信息和模式。基于已有的知识和关系进行推理和预测,提供更深入的洞察。
2024-07-24
1152
2
8
如何进行数据要素市场化改革
数据要素是指在数字经济中,以电子形式存在的、可量化、可传输、可分析、可交易的信息资源。它包括但不限于结构化数据、半结构化数据和非结构化数据,是数字经济时代的基础资源。数据要素作为一种新型生产要素,反映了随着数字化转型加速发展,数据对提高生产效率起到乘数的凸显作用。它与其他生产要素结合时能够增加产出,是推动数字经济发展的核心引擎,是赋能行业数字化转型和智能化升级的重要支撑,也是国家基础性战略资源。例如,数据要素可以推动信息技术发展、促进传统产业转型升级、推动社会治理创新以及驱动经济发展等。
2024-07-24
882
4
8
强制访问控制(Mandatory Access Control,MAC)
强制访问控制(Mandatory Access Control,MAC)是一种访问控制模型,在该模型中,系统根据预先定义的安全策略和数据的安全级别来决定访问权限,用户通常无法自主更改这些权限。MAC 常用于对安全性要求极高的环境,如军事、政府和关键基础设施等领域。在 MAC 中,数据被标记为不同的安全级别(例如“绝密”“机密”“秘密”“公开”等),用户也被赋予相应的安全许可级别。只有当用户的许可级别高于或等于数据的安全级别时,才被允许访问该数据。
2024-07-23
670
1
13
公共数据开放服务
公共数据是指由公共机构在依法履行职责或者提供公共服务过程中产生、收集和整理的数据。公共数据具有以下特点:1. 来源的公共性:通常由政府部门、公共事业单位或受政府委托的机构所持有和管理。2. 目的的公益性:旨在为社会公众提供服务、促进公共利益和社会发展。
2024-07-22
1193
3
9
ABAC 数据访问控制
ABAC 即基于属性的访问控制(Attribute-Based Access Control)。在这种模型中,访问决策是基于主体(如用户、进程等)、客体(如数据、资源等)、环境(如时间、地点等)以及操作(如读取、写入、删除等)的属性来确定的。例如,一个用户能否访问特定的数据,不仅取决于其身份(主体属性),还可能取决于当前的时间(环境属性)、数据的敏感性(客体属性)以及所需执行的操作类型(操作属性)。
2024-07-22
979
2
3
数据访问控制(Data Access Control)
数据访问控制(Data Access Control)是指通过一系列策略、机制和技术手段,对数据资源的访问进行管理和约束,以决定谁(主体,如用户、进程、系统)在什么条件下(如时间、地点、网络环境)可以对何种数据(客体)进行何种操作(如读取、写入、修改、删除等),从而确保数据的安全性、完整性和可用性,防止未授权的访问、滥用、篡改或泄露。
2024-07-22
625
4
8
个人信息保护(Personal Information Protection)
个人信息保护(Personal Information Protection)指的是采取一系列措施来确保个人的信息不被未经授权的收集、使用、披露、篡改或销毁,以保障个人的隐私和权益。一、个人信息的范畴通常包括但不限于姓名、身份证号码、地址、电话号码、电子邮件地址、健康状况、财务信息、生物识别信息(如指纹、面部识别)等能够单独或者与其他信息结合识别特定自然人身份的各种信息。
2024-07-21
722
7
9
数据分类分级(Data Classification and Grading)
数据分类分级(Data Classification and Grading)是根据数据的属性、特征和重要程度等因素,将数据划分为不同的类别和级别,以便对数据进行有针对性的管理、保护和使用。一、数据分类的目的1. 提高数据管理的效率和准确性,使数据更容易被查找、理解和使用。2. 支持合规性要求,确保数据处理符合法律法规和行业标准。
2024-07-21
559
2
1
如何提升密码校验安全?
在当今数字化时代,信息安全威胁日益严峻。从个人隐私泄露到企业商业机密被窃取,各种安全事件层出不穷。而实体鉴别作为保障信息系统安全的第一道防线,其重要性不言而喻。密码校验(Password Verification)是验证用户输入的密码是否与系统中存储的密码匹配的过程。密码通常在存储前经过哈希处理,以增加安全性。
2024-07-20
592
6
13
数据匿名化(Data Anonymization)
数据匿名化(Data Anonymization),是一种技术过程,从数据集中移除或修改个人信息,以防止数据被用于识别任何特定的个人。这个过程确保了数据的发布或共享不会侵犯个人隐私,同时还能保持数据的分析和研究价值。一、主要目的1.保护个人隐私:防止个人身份和敏感信息被直接识别和关联,确保数据主体的隐私不受侵犯。例如,在医疗数据中,避免患者的疾病信息与个人身份直接关联,以防个人医疗隐私泄露。
2024-07-20
1064
6
12
数据隐私保护的七大原则
数据隐私保护(Data privacy protection)是一个日益重要的议题,尤其是在数字经济快速发展的背景下。数据是数字经济的战略资源,但互联网企业大量收集用户隐私数据,可能引发大数据杀熟定价和网络诈骗等问题,严重阻碍数字经济的持续健康发展。因此,保护用户隐私是促进数字经济高质量发展的基本前提和重要保障。
2024-07-20
1057
0
12
-
-
© 2021 - 现在 杭州极深数据有限公司 版权所有
(深数据® DEEPDATA® 极深®)
联系我们
浙公网安备 33018302001059号
浙ICP备18026513号-1号