首页> 中国专利> 数字水印嵌入装置、数字水印检测装置、数字水印嵌入方法、数字水印检测方法、数字水印嵌入程序以及数字水印检测程序

数字水印嵌入装置、数字水印检测装置、数字水印嵌入方法、数字水印检测方法、数字水印嵌入程序以及数字水印检测程序

摘要

数字水印嵌入装置包括:生成单元,其使用所输入的密钥随机数,并输出用于确定第一频带和第二频带的滤波器,其中所述第一频带和所述第二频带表示数字水印位将要被嵌入其中的至少单个频带对;以及嵌入单元,其在数字水印位将要被嵌入所输入的语音信号的单位帧中时,以第一频带的振幅频谱强度总和大于第二频带的振幅频谱强度总和的方式,改变第一频带和第二频带中的至少一个频带的振幅频谱强度总和。

著录项

  • 公开/公告号CN105283915A

    专利类型发明专利

  • 公开/公告日2016-01-27

    原文格式PDF

  • 申请/专利权人 株式会社东芝;

    申请/专利号CN201380077328.7

  • 发明设计人 中村匡伸;

    申请日2013-06-11

  • 分类号G10L19/018;G10L25/18;

  • 代理机构北京市中咨律师事务所;

  • 代理人刘薇

  • 地址 日本东京都

  • 入库时间 2023-12-18 13:47:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-07-07

    未缴年费专利权终止 IPC(主分类):G10L19/018 专利号:ZL2013800773287 申请日:20130611 授权公告日:20190507

    专利权的终止

  • 2019-05-07

    授权

    授权

  • 2016-02-24

    实质审查的生效 IPC(主分类):G10L19/018 申请日:20130611

    实质审查的生效

  • 2016-01-27

    公开

    公开

说明书

技术领域

本发明的实施例涉及数字水印嵌入装置、数字水印检测装置、数字水 印嵌入方法、数字水印检测方法、数字水印嵌入程序以及数字水印检测程 序。

背景技术

最近几年,在语音信号处理技术中,可以合成各种语音。然而,它也 涉及诸如使用合成语音模拟熟人的声音或者滥用著名公众人物的语音的风 险。为了防止这种犯罪的发生,已存在用于在合成语音中嵌入附加信息并 检测任何滥用的需求。例如,嵌入附加信息的已知方法的例子包括使用声 学掩蔽现象来嵌入数字水印的方法、以及嵌入数字水印并将其伪装成量化 噪声的方法。另外,附加信息信号被嵌入语音数据的频谱分布的频率振幅 特性中的方法也是已知的。

专利文献1:特开2006-171110号公报

非专利文献1:岩切、松井的“DigitalWatermarkSchemeforHigh QualityAudioDatabySpectrumSpreadingandModifiedDiscreteCosine Transform(通过频谱扩展和改进离散余弦变换的用于高质量音频数据的 数字水印方案)”,电子、信息和通信工程师协会,第39卷,1998年第9 期。

发明内容

然而,在通过陆线电话或蜂窝电话的会话期间,由于对于原始语音发 生的编解码失真,因此所嵌入的水印变得容易消失,从而难以检测附加信 息。

鉴于上述的问题而提供了本发明的实施例,其目的在于提供嵌入装置 和检测装置,其使得能够对于陆线电话或蜂窝电话嵌入并检测具有防止各 种失真的数字水印并在维持附加信息的保密性上优异。

为了解决上述问题并实现目的,根据本发明的实施例提供了一种数字 水印嵌入装置,其包括:生成单元,其使用所输入的密钥随机数,并输出 用于确定第一频带和第二频带的滤波器,其中第一频带和第二频带表示数 字水印位将要被嵌入其中的至少单个频带对;以及嵌入单元,其在数字水 印位将要被嵌入所输入的语音信号的单位帧中时,以第一频带的振幅频谱 强度总和大于第二频带的振幅频谱强度总和的方式,改变第一频带和第二 频带中的至少一个频带的振幅频谱强度总和。

附图说明

图1是示出根据实施例的数字水印嵌入装置的方框图;

图2是示出根据实施例的数字水印检测装置的方框图;

图3是用于说明根据实施例的由嵌入单元嵌入数字水印的方法的图;

图4是用于说明根据实施例的由生成单元生成子带滤波器的方法的 图;

图5是示出根据实施例的变形例的数字水印嵌入装置的方框图;

图6是示出根据实施例的变形例的数字水印检测装置的方框图;

图7是示出根据实施例的硬件配置的图。

具体实施方式

数字水印嵌入装置和检测装置的示例性实施例将参考附图在下面描 述。图1是说明数字水印嵌入装置的功能配置的方框图。如在图1中所示, 数字水印嵌入装置1包括提取单元101、变换实施单元102、嵌入单元103、 逆变换实施单元104、再合成单元105和生成单元106。数字水印嵌入装置 1接收语音信号10和密钥随机数16的输入;并输出数字水印被嵌入其中 的合成语音15。

提取单元101获取来自外部的语音信号10输入。在此,语音信号10 是使用诸如麦克风的输入装置的输入。提取单元101每单位时间从语音信 号10中剪切具有持续时间2T(例如,2T=64毫秒)的语音波形,并生成 在时间(t)的单位语音帧11。在以下的说明中,持续时间2T也被称为分 析窗口宽度。除了执行用于剪切具有持续时间2T的语音波形的操作之外, 提取单元101还可执行用于除去所剪切的语音波形的直流分量的操作、用 于强调所剪切的语音波形的高频分量的操作、以及用于将窗函数(例如, 正弦窗)与所剪切的语音波形相乘的操作。然后,提取单元101向变换应 用单元102输出单位语音帧11。

变换实施单元102从提取单元101接收单位语音帧11的输入。然后, 变换实施单元102对于单位语音帧11执行正交变换,并将单位语音帧11 投射到频域上。正交变换可根据诸如离散傅立叶变换、离散余弦变换、修 正离散余弦变换、正弦变换或离散小波变换的变换方法来执行。随后,变 换实施单元102向嵌入单元103输出正交变换后单位帧12。

生成单元106接收密钥随机数16的输入,并使用所输入的密钥随机数 16生成子带滤波器17。子带滤波器17表示根据随机数序列随机决定P组 和N组的宽度的滤波器,其中P组和N组是用于嵌入数字水印的频带。 在本实施例中,假定P组频带是第一频带,N组频带是第二频带,并假定 1位水印位能够嵌入在单位帧12中。在将具有两位或更多位的水印位嵌入 单位帧12的情况下,期望设置两对或更多对的P组和N组。同时,由生 成单元106执行的操作流程在后面描述。生成单元106向嵌入单元103输 出所生成的子带滤波器17。

嵌入单元103从变换实施单元102接收单位帧12的输入,并接收子带 滤波器17的输入。然后,对于每个单位帧12,嵌入单元103将数字水印 嵌入由子带滤波器17指定的子带中。嵌入数字水印的方法在后面叙述。嵌 入单元103向逆变换实施单元104输出嵌有水印的单位帧13。

逆变换实施单元104从嵌入单元103接收嵌有水印的单位帧13的输 入。然后,逆变换实施单元104对于嵌有水印的单位帧13执行逆正交变换, 并将其返回到时域。逆正交变换可根据逆离散傅立叶变换、逆离散余弦变 换、逆修正离散余弦变换、逆离散正弦变换或逆离散小波变换来执行。然 而,期望逆正交变换对应于由变换实施单元102实施的正交变换。随后, 逆变换实施单元104向再合成单元105输出逆正交变换后单位帧14。

再合成单元105从逆变换实施单元104接收逆正交变换后单位帧14 的输入。然后,对于逆正交变换后单位帧14,再合成单元105重叠前一帧 和下一帧,并获取总和,以便生成嵌有水印的合成语音15。同时,如果提 取单元101已经执行了除了剪切语音波形之外的任何操作,则适于执行相 应的逆操作。也就是说,如果执行了用于除去所剪切的语音波形的直流分 量的操作,则执行用于将所除去的直流分量返回到单位帧14的操作。如果 执行了用于强调所剪切的语音波形的高频分量的操作,则执行用于恢复单 位帧14的所强调的高频分量的操作。如果执行了用于将窗函数与所剪切的 语音波形相乘的操作,则执行用于将窗函数(例如,正弦窗)与单位帧14 相乘的操作。同时,单位帧14的前一帧和下一帧在例如分析窗口长度2T 的一半的持续时间T上重叠。

下面参考图2说明数字水印检测装置2,其检测由图1所示的数字水 印嵌入装置1在语音中嵌入的数字水印。如图2所示,数字水印检测装置 2包括提取单元101、变换实施单元102、水印检测单元107和生成单元106。 提取单元101、变换实施单元102和生成单元106具有与图1所示的数字 水印嵌入装置1中的配置相同的配置。数字水印检测装置2接收嵌有水印 的合成语音15和密钥随机数16的输入,并输出嵌入在所输入的合成语音 15中的水印位串18。然后,所输入的嵌有水印的合成语音15通过提取单 元101和变换实施单元102,提取已被投射到频域上的单位帧12。

水印检测单元107从变换实施单元102接收单位帧12的输入。然后, 对于每个单位帧12,水印检测单元107从由子带滤波器17指定的频带中 取出水印信息。检测数字水印信息的方法稍后描述。随后,水印检测单元 107输出水印位串18。

下面给出由生成单元106生成子带滤波器的方法的说明。子带滤波器 生成单元106具有增强数字水印信息的保密性的作用。生成单元106生成 对于水印将要被嵌入其中的数字数据是唯一的子带滤波器17。子带滤波器 17表示根据随机数序列随机决定P组和N组的宽度的滤波器,其中P组 和N组是用于嵌入数字水印的频带。子带滤波器17根据图4所示的操作 流程来生成。

子带滤波器17首先决定K个代表频段(frequencybin)(例如,K= 21)。然后,子带滤波器17以代表频段属于各个频带内部的方式,使用 K+1个随机数序列来随机决定每个代表频段的代表频率边界R。例如,子 带滤波器17使用所输入的密钥随机数16生成K+1个随机数序列,并使用 随机数值决定代表频段的边界。

子带滤波器17将一个代表频段的代表频率边界E看作子带边界,并 生成子带滤波器。关于决定代表频段的方法,可以考虑各种方法,诸如其 中所有频段以线性方式等分并选择其中心的方法;或者其中频率轴用对数 尺度均分并选择其中心的方法。同时,关于其中具有不同子带边界的子带 滤波器使用密钥随机数16创建的操作,可以实施除了上述方法以外的其中 预先决定代表频段的方法。

例如,可以考虑以下的方法:

·使用在数量上等于数字水印将要被嵌入其中的频带数量的随机数序 列的值来获取所有频段的分频比并决定子带边界的方法。

·预先提供具有不同子带边界的多个子带滤波器并使用密钥随机数16 决定将被应用的子带滤波器的方法。

然后,嵌入单元103从以这种方式生成的频带中选择包括实际设置为 P组和N组的频带的频带。

下面参考图3说明由嵌入单元103嵌入数字水印的方法。在图3中, 左侧图表示由变换实施单元102输出的特定单位帧12。水平轴表示频率, 而垂直轴表示振幅频谱强度。在本实施例中,在图3中,设置两种类型的 频带,即P组和N组。频带包括至少两个或更多个相邻频段。就设置P 组和N组的方法而言,整个频带基于某一规则而被划分为指定数量的频带, 然后可从所划分的频带中选择P组和N组。同时,P组和N组可以被设置 成在所有单位帧12中相同,或者可以对于每个单位帧12改变。

在每个单位帧12中,1位的水印位{0,1}使用数字水印被嵌入为附加 信息。当|X(Wk)|表示在时间t的第k个频段Wk的振幅频谱强度时,并且 当ΩP表示所有频段属于P组的集合时,属于P组的所有频段的振幅频谱 强度总和表示为如下给出的等式(1)。

Σk:ωkΩP|Xt(ωk)|=SP(t)---(1)

以相同的方式,属于N组的所有频段的振幅频谱强度总和被表示为 SN(t)。此时,SN(t)与SP(t)之间的大小关系根据将要嵌入的水印位改变,以 使得满足以下表达式:

SP(t)≥SN(t),如果水印位“1”将要被嵌入;

SP(t)<SN(t),如果水印位“0”将要被嵌入。

作为示例,考虑水印位“1”将要被嵌入所有单位帧12中的情况。在 所有单位帧12中嵌入水印位“1”的情况下,每个频段的强度可以所有单 位帧中的振幅频谱强度总和的大小关系满足SP(t)≥SN(t)的方式来改变。 例如,如在图3的右下处所示的,可以考虑其中增加属于P组的所有频段 的振幅频谱强度并降低属于N组的所有频段的振幅频谱强度的方法。就振 幅频谱强度的增量值或减量值而言,期望使用听觉心理模型并设置根据每 个频段难以感知的值。同时,在上面给出的描述中,说明了用于在所有单 位帧12中嵌入水印的方法。然而,可选择地,水印可以不嵌入某些单位帧 12中。在未嵌入水印的情况下,当执行水印检测操作时,单位帧12的频 带必然满足任一个等式,并且所检测到的位串{0,1}倾向于以基本相等的概 率随机出现。因此,为了嵌入数字水印,期望使用诸如“00000......”或 “01010......”的对于每个单位帧具有某一规律性的位数组。将要被嵌入的 水印位数组可以预先决定,或者可根据特定算法自动生成。然而,为了数 字水印检测装置2检测由数字水印嵌入装置1嵌入的水印,需要使用在两 个装置之间共有的水印位数组。

下面给出由水印检测单元107检测数字水印(附加信息)的说明。在 根据本实施例的水印检测操作中,对于每个单位帧12,从表示由所输入的 子带滤波器17指定的P组和N组中取出单个嵌入的位。当存在两对或更 多对P组和N组时,随后的水印检测操作逐对地执行,并取出两个或更多 个嵌入的水印位。当SP(t)表示属于P组的频段的振幅频谱强度总和,SN(t) 表示属于N组的频段的振幅频谱强度总和时,根据以下表达式使用SP(t) 和SN(t)检测嵌入的位:

如果满足SP(t)≥SN(t),则嵌入的水印位是“1”;

如果满足SP(t)<SN(t),则嵌入的水印位是“0”。

也就是说,在该方法中,嵌入的1位水印根据频带(即P组和N组) 的振幅频谱强度总和的大小关系来提取。因此,在数字水印检测装置2中, 如果与在数字水印嵌入装置1中使用的密钥随机数相同的密钥随机数16 不可用,并且如果P组和N组的子带边界是未知的,则难以准确地检测水 印位,即使执行了振幅频谱强度总和的大小比较。

下面给出传统的用于嵌入数字水印的方法的说明。一个代表性的方法 是改变特定频段的振幅频谱强度。在该方法中,对于根据修正离散余弦变 换(MDCT)计算的每个单位语音帧,特定频段的MDCT系数(振幅频 谱强度)根据将要嵌入的水印位{0,1}改变。作为根据水印位{0,1}量化 MDCT系数的结果,1位附加信息被嵌入每个单位语音帧中。

在该方法中,由于水印仅被嵌入在特定频段中,因此,优点是实现高 的嵌入效率。然而,缺点是噪声容忍度相对较弱。为了增强噪声容忍度, 如果通过增加量化宽度来增加水印强度,则特定频段的值显著改变,从而 导致数字水印的非感知性的下降。

作为提高噪声容忍度的一个方法,在每个单位帧中选择一组两个频段, 并根据每个频带中的振幅频谱强度总和的大小关系来定义水印位{0,1}。 该方法如下定义:在每个单位帧中,包括在特定频带中的多个频段被划分 成偶数频段和奇数频段。然后,如果在水印位中嵌入“1”,则偶数频段的 振幅频谱强度总和被设置为高于奇数频段的振幅频谱强度总和。然而,如 果在水印位中嵌入“0”,则偶数频段的振幅频谱强度总和被设置为低于奇 数频段的振幅频谱强度总和。通过如在此所述的逐个频带地改变振幅频谱 强度,而不是对每个频段改变振幅频谱强度,附加信息也能够以相对鲁棒 的方式嵌入加性噪声或乘法性失真中。

然而,在这种情况下,缺点是所嵌入的水印信息的保密性处于低水平。 也就是说,如果水印信息被嵌入其中的频带(P组和N组)中的信息被破 解器泄露,则这意味着水印信息可以欺诈方式获得。在这方面,作为用于 增强保密性的一个典型方法,通常实施下面的方法。

更具体地,在改变每个单位帧中的MDCT系数时,根据从密钥随机 数中提取的随机数值来选择一个或多个频段,并改变所选择的频段的 MDCT系数。作为实施该方法的结果,只要破解器没有获得密钥随机数, 就很难获得水印信息。

然而,在使用密钥随机数选择嵌入用的频段的方法中,可能降低数字 水印的非感知性。根据在诸如MPEG的媒体压缩技术中经常使用的听觉心 理模型,人的听觉是使得某些频带容易听见而某些频带很难听见。因此, 不可能排除使用密钥随机数随机选择的频段是对人容易听见的频带的可能 性。

与用于嵌入并检测数字水印的这种传统嵌入方法和传统检测方法相 比,本实施例具有以下几方面的有益效果。通过在多个频带中嵌入数字水 印,而不是在特定频段中嵌入水印,可提高噪声容忍度,并提供对陆线电 话或蜂窝电话的编解码失真、加性噪声和乘法失真的容忍度。

另外,由于在确定用于嵌入数字水印的频带中使用密钥随机数,因此, 即使存在水印信息被嵌入其中的频带的信息的泄漏,第三人盗取信息的可 能性可被减小到低水平。此外,将要被嵌入的数字水印根据多个频带中的 振幅频谱强度总和的大小比较来定义。因此,对于每个不同的密钥随机数, 用于嵌入水印的带宽是不同的,并且振幅频谱强度总和也同样是不同的。 其结果是准确地取出所嵌入的水印变得困难。

此外,存在数字水印的非感知性的高可能性。在传统的根据随机数序 列决定用于嵌入水印的频段(或频带)的方法中,存在根据随机数序列选 择对人容易听见的频带的可能性。与此相反,在本实施例中,由于指定对 人很难听见的频带的代表频段,因此,在归因于随机数序列的数字水印的 非感知性方面没有实质上的下降。

(变形例)

在上述的实施例中,使用密钥随机数生成子带滤波器。为了进一步增 强保密性,还可以设置子带滤波器控制单元508。如在图5中所示,除了 具有在上述的实施例中说明的配置以外,数字水印嵌入装置3还包括子带 滤波器控制单元508。生成单元506根据所输入的密钥随机数16生成一个 或多个子带滤波器57,并将其输出到子带滤波器控制单元508。因此,子 带滤波控制单元508从生成单元506接收一个或多个子带滤波器57的输 入。然后,子带滤波器控制单元508向每个单位帧12输出适用的单个子带 滤波器58。

当在每个单位帧12中嵌入水印时,子带滤波器控制单元508从一个或 多个子带滤波器之中选择单个适用的子带滤波器。对于子带滤波器选择可 以有各种方法。例如,可以考虑子带滤波器在每N个帧(其中,N是等于 或大于1的整数)后改变的方法。同时,为了不在特定单位帧12中嵌入数 字水印,子带滤波器控制单元508可输出不应用子带滤波器的控制信号。

如果对每个单位帧12选择适用的子带滤波器,则也可以在图6所示的 数字水印检测装置4中类似地设置子带滤波器控制单元508。子带滤波器 控制单元508遵循与在数字水印嵌入装置3中的相同的算法,并将子带滤 波器应用于用作检测的目标的单位帧12。

采用这种配置,可以选择使用密钥随机数生成的一个或多个子带滤波 器,并将其应用于每个单位帧12,从而使得能够实现在将被应用的子带滤 波器的保密性方面的增强。

下面参考图7说明根据实施例的数字水印嵌入装置和检测装置的硬件 配置。图7是示出根据实施例的数字水印嵌入装置和检测装置的硬件配置 的说明图。

根据实施例的数字水印嵌入装置和检测装置包括诸如CPU(中央处理 器)51的控制装置、诸如ROM(只读存储器)52和RAM(随机存取存 储器)53的存储器装置、建立与网络的连接并执行通信的通信I/F54以及 将构成元件彼此连接的总线61。

在根据实施例的数字水印嵌入装置和检测装置中执行的程序被预先存 储在ROM52等中。

可选择地,在根据实施例的数字水印嵌入装置和检测装置中执行的程 序可以在诸如CD-ROM(压缩盘只读存储器)、软盘(FD)、CD-R(可 记录的压缩盘)或DVD(数字多功能盘)的计算机可读记录介质中被记录 为可安装文件或可执行文件;并可被提供为计算机程序产品。

可选择地,在根据实施例的数字水印嵌入装置和检测装置中执行的程 序可以被保存在连接到网络(诸如因特网)的计算机上作为可下载文件, 或者可用于通过网络(诸如因特网)分发。

在根据实施例的数字水印嵌入装置和检测装置中执行的程序可使计算 机如以上描述的构成要素起作用。在该计算机中,CPU51可以将程序从 计算机可读存储介质读取到主存储装置中并执行该程序。

尽管已经描述了本发明的某些实施例,但是,这些实施例仅作为示例 给出,并不旨在限制本发明的范围。事实上,在此描述的新颖的方法和系 统可以以其它各种形式体现;此外,在不脱离本发明的精神下,可以对在 此描述的方法和系统的形式进行各种省略、替代和改变。所附的权利要求 及其等同旨在覆盖这样的形式或修改,其落入本发明的范围和精神之内。

参考标记列表

1:数字水印嵌入装置

2:数字水印检测装置

3:数字水印嵌入装置

4:数字水印检测装置

10:语音信号

11:单位语音帧

12:单位帧

13:水印单位帧

14:单位帧

15:合成语音

16:密钥随机数

17:子带滤波器

18:水印位串

57:子带滤波器

58:子带滤波器

101:提取单元

102:变换实施单元

103:嵌入单元

104:逆变换实施单元

105:再合成单元

106:子带滤波器生成单元

107:水印检测单元

506:生成单元

508:子带滤波器控制单元

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号