• 主页
  • 相册
  • 随笔
  • 目录
  • 存档
Total 244
Search AboutMe

  • 主页
  • 相册
  • 随笔
  • 目录
  • 存档

数字内容安全备忘录

2020-01-02

1. 基础概念

信息

它们均指与具体表达形式、编码无关的知识、事物、数据等含义

数字内容

  • 数字内容是信息的一种表现形式
  • 数字内容,就是以数字形式存在的文本、图像、声音、视频等信息,它可以存储在光盘、硬盘等数字载体 上,并通过网络等手段传播

空间分辨率(Spatial Resolution)

Spatial resolution is a term that refers to the number of pixels utilized in construction of a digital image. Images having higher spatial resolution are composed with a greater number of pixels than those of lower spatial resolution

灰度分辨率(Gray-level Resolution)

Gray-level resolution is a term that refers to the number of shades of gray utilized in preparing the image for display. Digital images having higher gray-level resolution are composed with a larger number of gray shades and are displayed at a greater bit depth than those of lower gray-level resolution.

灰度级分片(Gray Level Slicing)

Grey level slicing is equivalent to band pass filtering. It manipulates group of intensity levels in an image up to specific range by diminishing rest or by leaving them alone.

2. 感知哈希

3. 基本概念

感知

人类通过感觉器官获得客观事物的有意义印象的过程, 包括感觉和知觉

感觉

是客观事物的个别属性通过感觉器官在人脑中的反映

知觉

是基于感觉所获得的各种属性, 经过分析综合, 并借助于知识经验等所形成的对客观事物的有意义的整体印象

认知

在感知的基础上, 结合记忆、想象和思维等信息加工过程,将外界刺激转换成内在的心理活动, 并做出反应进而支配人的行为

感知阈值理论指出, 只有当客观事物所带来的刺激超过感知阈值时, 客观事物才能为人所感知, 在这之前, 都只是相同的”数据”. 因此, 认知过程各集合间的映射是多对一映射, 如图 1 所示**. 差异小于感知阈值的一类元素被映射为下一集合中的一个元素**

传统哈希与感知哈希

图 2 说明了, 从传统的密码学意义下数据认证的哈希函数的概念, 引申到多媒体信息感知内容认证的感知哈希函数, 乃至可能的认知内容认证的认知哈希函数的过程

* 哈希函数

哈希函数(Hash Functions)不可逆的提取原始数据的数字摘要 (Digest), 具有单向性、脆弱性等特点, 可保证原始数据的唯 一性与不可篡改性

  • 传统哈希的局限

    • 已无法满足多媒体信息管理和保护的需求
    • 多媒体的感知冗余需要有针对性的摘要技术. 传统哈希函数仅具有数据压缩性 不能消除多媒体感知内容上的冗余
    • 多媒体数字化表示(Digital Presentation)与该媒体内容 (Multimedia Content)之间的多对一映射特性要求内容摘要具有感知鲁棒性.而传统哈希函数对任何数字表示改变都是脆弱的
  • 感知哈希(Perceptual Hashing)

    • 理论基础

      认知心理学:人认知多媒体的心理过程

    • 定义

      由多媒体数据集到多媒体感知摘要集的一类单向映射,将具有相同感知内容的多媒体数字表示唯一的映射为一段数字摘要, 并满足感知安全性要求.

    • 以图搜图

      对每张图片生成一个”指纹”(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。

感知哈希的一种简单实现

  • 缩小尺寸

    将图片缩小到8x8的尺寸,总共64个像素。这一步的作用是去除图片的细节,只保留结构、明暗等基本信息,摒弃不同尺寸、比例带来的图片差异

    • 缩小尺寸的原理:分块取平均数
  • 简化色彩

    将缩小后的图片,转为64级灰度。也就是说,所有像素点总共只有64种颜色

  • 计算平均值

    计算所有64个像素的灰度平均值

  • 比较像素的灰度

    将每个像素的灰度,与平均值进行比较。大于或等于平均值,记为1;小于平均值,记为0

  • 计算哈希值

    将上一步的比较结果,组合在一起,就构成了一个64位的整数,这就是这张图片的指纹

    得到指纹以后,就可以对比不同的图片,看看64位中有多少位是不一样的。在理论上,这等同于计算”汉明距离”(Hamming distance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片

  • remark:可以看到没用到传统的哈希函数

感知哈希的应有特性

  • 抗碰撞性(Collision Resistance)/区分性(Discrimination)
    • 感知内容不同的多媒体数字表示不会映射为相同的感知哈希值(内容敏感性)
  • 感知鲁棒性(Robustness)
    • 经过内容保持操作, 感知内容相同的不同多媒体数字表示仍映射为同一哈希值
  • 单向性(One-wayness)
    • 相当于无法逆推
  • 随机性(Randomicity)
    • 感知哈希值的熵等于其数据长度, 即,理想的感知哈希值应当是完全随机的
  • 摘要性(Compactness)
    • 感知哈希值所占的数据容量应尽可能小
  • 易于实现,计算效率高

感知哈希的总体框架

  • 多媒体数字表示可以是音频、图像、视频
  • 感知特征提取以人类感知模型为基础, 得到多媒体对内容保持操作的感知不变量.
  • 分帧、滤波等预处理, 可提高特征选择的准确性.
  • 而通过与人类感知模型一致的各种信号处理方法, 可去除感知冗余, 选择最具有感知意义的特征参数.
  • 哈希构造:对感知特征进一步降维, 并输出最终结果——感知哈希值

在不同阶段实现对密钥的依赖

感知哈希与数字指纹

目前, 对于数字指纹的定义和使用较为混乱. 但主要分为两类:

  • 一为应用于版权保护的数字水印技术 ;
  • 二为应用于媒体内容识别的媒体摘要技术 .

感知哈希 技术与后者类似, 也是多媒体的一种数字摘要, 但是比数字指纹技术更强调安全性

感知哈希的应用

  • 识别

  • 抗碰撞性和感知鲁棒性是首要的性能指标.

  • 检索

  • 由于检索的精度要求低于识别,而对于效率则有很高的要求. 因此,压缩性是应用于检索的感知哈希函数的研究重点, 而其次是感知鲁棒性和区分性

  • 认证

  • 感知哈希值必须具有较高的单向性和抗碰撞性

4. 图像加密

定义

利用数字图像的特性设计加密算法,以提高加密的安全性和运算效率的一种技术

分类

  • 空域图像加密技术:在未压缩的图像上进行加密, 其特征是将图像看作二维数据进行操作。典型方法是采用离散混沌加密技术
  • 压缩图像加密技术:基于某种压缩格式或压缩技术进行加密,如JPEG、算术编码、小波压缩技术等

5. 实现

基于古典密码体制的图像加密

  • 置乱加密
  • 伪随机序列加密(灰度加密)

基于像素置乱的图像加密

  • Arnold变换(猫脸变换)

    • 定义

      利用Arnold变换(又称猫脸变换)可以对图像进行置乱,使得原本有意义的图像变成一张无意义的图像。该变换可以在其它图像处理前对图像做预处理,例如在数字盲水印嵌入前对水印进行置乱。也可以用于普通的图像加密。
      通常一次Arnold变换达不到理想效果,需要对图像进行连续多次的变换。Arnold变换具有周期性,即对图像连续进行Arnold变换,最终又能得到原图像。变换的周期和图像的尺寸有关。
      当图像是一张方形的图像时,Arnold变换存在逆变换。经过N次Arnold变换后的数据可以通过N次逆变换恢复数据。
      Arnold变换不仅可以用于图像置乱,也可以用于其它数据的置乱和加密。

    置乱的实质是新位置与旧位置的映射,且该映射是一一对应的

    • 变换算法

      • 矩阵形式

      • 多项式形式

N是正方形图像的边长,(x’, y’)是像素点(x, y)变换后的坐标

  • 效果

  • 多次变换s

  • 逆变换

    • 矩阵形式

    • 多项式形式

  • 缺点

    • 密钥量小,置乱视觉效果差。

    • 置乱仅仅是重新排列图像各像素点的位置,像素值并没有发生改变,这样攻击者就可以通过统计分析等手段进行破译

基于现代密码体制的图像加密

现代加密体制

  • 对称加密:如AES、DES等,效率高
  • 非对称加密:如RSA等,效率低
  • 直接加密:数据量大,加密结果不具兼容性
  • 常用于对图像部分数据加密

基于混沌系统的图像加密

  • 通过混沌系统生成伪随机的混沌序列对图像加密

  • Logistics映射加密

    • 概述


      当迭代n次后,我们就得到了X(1)、X(2)、…,X(n)这么n个值。那么这就是一个混沌序列,是一维的暂且称作序列A,也就是我们想要得到的序列,在MATLAB中,可以看出X(i)(i=1,2,…,n)的取值是在(0,1)之间的——这是一个很好地特性,就像图像灰度值是在(0,255)之间一样。那么我们把这个一维序列归一化到(0,255)之间得到序列B。


      对于一幅M*N大小的图像(暂且称为Picture),我们需要产生一个同样大小的矩阵来对其进行加密。如此说来,只需要迭代M*N次得到序列A,再转成序列B,此时序列B是一维的,将其转化成M*N的二维矩阵(暂且称为Fuck)。因此,用Fuck与Picutre进行异或,便可得到一幅新的图像,称作Rod,如此便完成了一次图像加密,加密后的图像为Rod

    • $Logisitcs$函数:$X(k+1) = u · X(k) · [1 - X(k)]$

      • 初值:$u$,$X(0)$
      • 当初始$u\in (3.5699456,4)$,$X(0)\in (0,1)$,该函数处于混沌状态(无序、不可预测、混乱)
    • 加密算法

      • 迭代生成序列$A$
      • 归一化成序列$B$
      • 对序列$B$取整,得到与输入图像$I$相同的空间分辨率的随机图像$P(x,y)$
      • 生成加密后的图像$I’=I\bigoplus P$,其中$\bigoplus$表示比特面级异或运算
    • 解密

      • 按如上步骤重新生成随机图像$P$
      • 解密$I=I’\bigoplus P$
    • 特点

      • 安全度高
      • 直方图发生改变

基于频域的图像加密

  • 对频域变换系数加密
  • 选择加密(部分加密):结合HVS和图像特征,选择部分重要变换系数进行加密操作
  • 减少计算数据量,解密图像存在一定失真

6. 评价标准

安全性常见密文数据攻击:如已知明文攻击、穷举攻击||安全性分析:秘钥空间分析、统计特性分析
加密图像质量测试评价明文图像与加密图像之间的偏差||评价指标:如直方图偏差、SNR等
加密效率加解密速度、计算复杂度,实时性

7. 数字取证

定义

数字取证 (Digital Forensics)是数字化域内取证科学的统称 主要指恢复和调查在数字硬件或软件系统中所发现的数据文件材料;即为验证某推论,通过技术手段寻取相关数字证据的过程或行为

数字证据

也称电子证据,以电子的、数字的形式保存记录于计算机或数字设备/介质,或通过以上设备生成、发送、接受的能够证明过去事实存在的一切数据或信息。

  • 与传统证据相比
    • 较高的精密性和脆弱性
    • 较强的隐蔽性
    • 多媒体性
    • 收集迅速、易于保存、占用空间少、容量大

分类

  • 电子取证(Electric Forensics)
    • 电子取证主要研究除计算机和网络以外的电子产品中的数字证据获取、分析和展示
  • 计算机取证(Computer Forensic)
    • 计算机取证的主要方法有对文件的复制 被删除文件的、 恢复、缓冲区内容获取、系统日志分析等等
  • 网络取证(Network Forensics)

数字图像篡改手段

  • 图像拼接
  • 计算机生成图形
  • 图像(对比度)增强
  • …

图像操作

**区别**
  • 主动认证
    • 数字水印:隐藏认证信息
    • 数字签名:附加签名数据
  • 被动认证
    • 数字取证

8. 数字图像取证

定义

数字图像取证是对数字图像操作取证和数字图像来源取证的统称

图像篡改取证技术分类

## 实现

基于场景几何的篡改取证方法

基于场景光照一致性的检测方法

基于成像设备特性的检测方法

基于操作痕迹的篡改取证方法

  • 图像区域复制粘贴型篡改取证(盲检测)

    • 基于块匹配的方法

      • DCT域字典排序

      • 空域分块结构特征

    • 基于特征点匹配的方法

      • SIFT特征点匹配

图像锐化滤波取证

9. 数字内容篡改取证技术的评价指标

数字内容篡改取证算法性能的一般评价指标为:

  • 准确度(Precision)
  • 完整度(Recall)

假设P和R分别表征 了检测算法的准确度和完整度

  • $P=\frac{篡改区域\bigcap检测区域}{检测区域}·100%$
  • $R=\frac{篡改区域\bigcap检测区域}{篡改区域}·100%$

10. 数字内容来源取证

含义

指对数字内容生成设备/方式的盲鉴别, 包括对设备类型、型号等具体参数的识别

数码照相机工作原理

**扫描仪成像工作原理**

扫描仪工作时 先由光源将光线照在欲输入的图稿上,产生表示图像特征的反射光或透射光。光学系统采集这些光 线,将其聚焦在CCD上,由CCD将光信号转换为电信号,然 后由电路部分对这些信号进行A/D转换及处理,产生对应的数字信号输送给计算机。

数码录音机工作原理

通常,可通过以下两种渠道获得数字音频。第一种就是 将现场声源的模拟信号或已存储的模拟声音信号通过某种方法转换成数字音频;第二种就是在数字化设备中创作出数字音频。

10.1. 数字内容来源取证的评价指标

  • 检测率(True Positive, TP):数字内容所对应的 来源被正确识别的比率
  • 虚警率(False Positive FP):数字内容所对应 的来源被错误识别的比率
  • ROC曲线:在数字内容来源取证中,通常用ROC 曲线来描述TP和FP之间的关系,ROC曲线的AUC可表征分 类器的性能

10.2. 数字内容来源取证方法

  • 数字图像来源取证方法

    • 基于图像的统计特征取证方法

    • 基于成像通道特性的取证方法

      任何成像传感器都有其固有的模式噪声,一般不易消除,故可当做内部水印使用


      由于装有单片CCD或CMOS的相机只能通过 颜色插值才能获得彩色图像,而不同厂家甚至不 同型号的相机使用不同的插值算法,只要能从测试图像中估计出插值周期,就可推算出所采用的插值算法,从而追溯出源相机

  • 数字视频来源取证方法

    • 基于摄像设备内在特性的视频来源取证
    • 利用视频码流特征进行来源取证

11. 参考资料

  • Cao Gang

  • 相似图片搜索的原理 - 阮一峰

  • 感知哈希综述 - 牛夏牧, 焦玉华(DOWNLOAD)

  • Arnold变换详解 - 简书

  • 1种改进的Arnold Cat 变换图像置乱算法 - 计算机工程与应用(DOWNLOAD)

  • 【图像加密】图像处理之Logistic混沌序列加密_logistic,混沌加密,混沌置乱_ -CSDN博客

  • Security
  • Content Security
常见蜜罐体验和探索实验
创建和使用DLL
  1. 1. 1. 基础概念
  2. 2. 2. 感知哈希
    1. 2.1. 3. 基本概念
  3. 3. 4. 图像加密
    1. 3.1. 5. 实现
    2. 3.2. 6. 评价标准
  4. 4. 7. 数字取证
    1. 4.1. 8. 数字图像取证
    2. 4.2. 9. 数字内容篡改取证技术的评价指标
    3. 4.3. 10. 数字内容来源取证
      1. 4.3.1. 10.1. 数字内容来源取证的评价指标
      2. 4.3.2. 10.2. 数字内容来源取证方法
  5. 5. 11. 参考资料
© 2024 何决云 载入天数...