技术文章

现场网络直播活动的录音技术

1.jpg

音频很重要

引人注目的视频对于吸引观众的注意力至关重要,但如果没有录音(或音轨),您的视频会感觉有点空洞。视频中的音频可以是很多内容 - 视频中演员的演讲,现场音乐,配音或任何这些东西的混合等等。

无论音频内容如何,捕获和录制的音频都会使观看者分散注意力,因为视频质量较差,也可能导致他们停止观看。

通过一个例子学习

本文中包含的信息虽然适用于许多音频情况,但特定于将模拟音频编码/记录为数字格式。

例如,我们假设您已经录制了一个现场活动,该活动的特色是民谣歌手演奏原声吉他。表演者有一个模拟混音器,您将从中收到音频输入。

模拟混频器的规格如下:

1.    0 VU = +4 dBu

2.    最大输出= 21 dBu

您正在使用的数字录音机上的模拟音频输入规格是:

1.    最大输入电平= 0.707 V RMS

2.    输入增益调整= 0至30 dB

这些值意味着什么?您将如何确保音频性能被正确编码和记录?要在此示例中与声音技术人员或任何其他实时流媒体和录制事件进行有效沟通,您需要充分了解用于表示其世界中音频电平的术语,语言和度量单位。

本文为您提供了确保录制和实时流包含最佳音频质量所需的术语和知识。

什么是“音质”?

音频质量是主观的,但大多数人都认为良好的音质是干净的,无失真的,并且音量舒适。

清晰的音频通常被定义为没有任何可听见的噪音,嘶嘶声/嗡嗡声或干扰如背景音。用于捕获干净音频的设备和技术超出了本文的范围 - 您的音频工程师将设置模拟音频设备,为您提供相对干净的音频,以便您进行数字化和记录。本文讨论的重点是编码并为听众提供高质量视频。

失真通常通过削波引入音频,这是由不正确的信号电平引起的。虽然失真通常用于很好的创作效果(例如吉他放大器的过载),但在音频编码过程中肯定要避免。

一个舒适的听力水平意味着一个播放音量级别使听者清晰地听到安静的部分,同时保证了更响亮的部分不健全不舒服响亮。播放音量水平应该需要最小的放大,以避免在再现中引入噪声。

较差的音频质量会引起人们的注意,而良好的音质通常会被忽视,使听众能够专注于音频中包含的信息。

音频信号

每个人都知道什么是音频信号,但要了解它们的行为方式,了解它们的外观也很有用。虽然没有真正替代实际收听音频,但视觉表示可以快速了解音频信号的结构。视觉效果可以确认您所听到的内容,并且可以让您在难以听取的环境中检测问题。

查看音频信号

以下音频样本是来自Epiphan制作的视频的画外音轨道,该视频推广了我们的一体化现场制作混音器产品Pearl。

在这种信号的可视化表示中,您可以清楚地识别暂停时的语音和振幅(水平)的峰值。注意音频具有我们之前确定的三种品质:

1.    清晰明确

2.    无失真及杂音

3.    音量适中,既不太大也不太小。

当我们放大此音频样本的较小部分时,您可以看到信号连续变化,并且个别变化不是非常突然,而是形状为圆形。存在非常直的过渡(垂直或平坦/水平)是原始信号失真的指示。

2.jpg

我们使用Adobe Audition来呈现我们音频信号的这些可视化表示,但几乎所有音频编辑软件都可以使用。如果要寻找低成本的音频软件,Audacity是一个免费程序,用于查看和分析录制的音频信号。

音频测量单元

音频信号具有各种测量单位。例如,检测声波并将其转换为电信号的麦克风指定其在声压级方面的输入及其在电压方面的输出。出于本讨论的目的,我们关注的是使用伏特或分贝的单位来指定和测量电域中的音频信号。

介绍分贝

虽然电路设计人员习惯于处理音频信号的电压电平(表示为伏特(V)或毫伏(mV)),但由于几个原因,这些单元对音频工程师来说是不方便的。

第一个原因是音频信号的可听范围非常大。使用线性标度(伏特所基于的)的测量需要使用非常宽范围的值来表示感兴趣的音频信号电平。例如,0.7mV至25000mV表示通常在音频记录中发现的信号范围。更方便的测量尺度将描述具有更窄范围的该信号范围。

电压水平对于音频工程师来说不方便的第二个原因是对于人类而言,音频信号电平的感知不是线性的。对于安静的信号,1伏信号增加是显着的,对于响亮的信号则是不可检测的。需要更方便的音频信号测量尺度以更好地将音频信号强度与人类听众的感知对齐。

单位分贝解决了这两个问题。分贝使用对数标度,更方便地表示遇到的各种输入信号。

3.jpg

分贝细节

分贝定义为:

dB = 20 * log10(Vact / Vref)其中Vact是实际电压,Vref是已知的参考电压

db = 10 * log10(Pact / Pref)其中Pact是实际功率,Pref是已知参考功率

没有必要在电压单位(或电源时的瓦特)和分贝之间进行转换,但是如果需要,有很多易于搜索的网络工具可以为您执行这些计算。

绝对与相对的衡量标准

根据定义,分贝(dB)是两个信号之间差异的度量:实际值和参考值。

该参考值是通常暗示或不确定的。例如,“ 我们有18 dB的余量 ”意味着一个特定的参考值,即剪切点(音频将失真的点),并且实际值(声级)低于此剪切点18分贝。

相反,“ 信号太低20dB ”意味着所需的参考信号,但未指定。在这种情况下,实际水平比未指定的期望水平低20 dB。说“ 我需要10 dB衰减 ”再次意味着未指定的所需参考值比当前实际电平低10 dB (衰减会降低音频电平)。

对于绝对值的规范,定义了导数单元,其指的是特定的绝对参考电平。音频信号有两个非常常见的参考电压:

1.    第一个参考值是1伏。当在上面的公式中将其用作Vref变量时,结果单位为dBV(以1伏为单位的dB)。

2.    第二个公共参考值是0.775伏特,当在上面的公式中用作Vref变量时,这导致单位dBu。

这些测量单位(dBV和dBu)用于指定绝对值(例如+4 dBu),而不是相对值(例如10 dB的衰减)。

由于dBV和dBu通常用于指定音频信号电平,因此有时需要在区分彼此时注意。由于分贝的对数性质,以dBu和dBV测量的信号之间产生的差异始终为2.2 dB(0 dbV = 2.2 dBu)。幸运的是,在许多情况下可以忽略这个小差异,因为它应该被构建到您为错误/机会留下的余量中。

名义和共同的绝对值

音频信号的范围很广,从大约-60到+30 dBu。设计单个电路以适当地适应如此宽的范围是不实际的,因此每个音频设备被设计成在信号上最佳地操作,这些信号落入更窄的值范围内。该窄信号范围的理想(平均)值称为标称值。

音频处理系统(例如前置放大器,混频器和其他所谓的线路输出设备)通常以相对高的电平(大约-15dBu至+ 5dBu)输出音频信号。相比之下,麦克风输出的信号电平要低得多(约-60 dBu至-40 dBu)。这种输出差异产生了通用术语“ 线路电平 ”和“ 麦克风电平 ”。

虽然“线路电平”信号没有单一的绝对电平,但有一些常见选项。专业音频设备通常以+4 dBu或0 dBu输出,而一些更加面向消费者的齿轮输出为-10 dBV(-7.8 dBu)。因此,“线路电平”信号可能相差12 dB,具体取决于所使用的齿轮。

麦克风电平也显着变化,但通常不低于-60dBu且不高于约-20dBu。甲麦克风前置放大器接受话筒电平信号,并且在线路电平放大这些信号,以输出。

大多数专业音频设备使用dBu或dBV单位指定输入和输出电平。但是,有一些齿轮可以指定电压方面的信号电平。这可以是平均均方根(RMS)电压,峰值电压或峰峰值电压。在任何情况下,使用上面的公式或在线提供的许多网站和应用程序很容易将这些级别转换为dBu。

音频工程师通常关注的是从-60 dBu到+30 dBu测量的信号电平  ,相对于按惯例建立并由设备供应商选择的参考电平单位(0 dB)。

动态范围

我们经常谈到音频信号电平,好像它们是不变的。但是,我们可以从示例音频剪辑的可视化中看到情况并非如此。我们如何为一个变化如此迅速且如此不可预测的信号分配一个奇异值?

4.jpg

我们使用两个值,而不是用表示“信号电平”(显然随时间变化很大)的奇异值来描述信号。

1.    第一个是电平的平均值(RMS),用绝对值表示(例如+4 dBu)。

2.    第二个值称为动态范围,表示信号从该平均值变化的程度,以dB表示(隐含参考值是RMS值)。

例如,如果我的信号的平均(RMS)值为-20 dBu但峰值为-7 dBu,则其动态范围为13 dB(-7 dBu减去-20 dBu)。

虽然RMS值和动态范围当然不能捕获音频信号的所有属性(例如频率内容),但它们对于许多音频处理功能(例如混合,放大和记录)来说足够好。

剪裁

为什么用RMS值和动态范围描述信号很重要?为什么平均(RMS)值不足以描述信号?答案是削减。

什么是剪辑?

每一件电子音频设备都有一个绝对的上限,它可以接受的信号电平,通过其电路处理并作为其输出产生。如果信号超过这些限制中的任何一个,它将被“修剪”。该上限通常称为剪切点。

5.jpg

从上图可以看出,削减信号仅仅防止信号达到其最大幅度,因此简单地导致稍微更安静的音频。不是这种情况。削减信号不仅会改变其幅度,还会使信号失真(增加原始信号中不存在的谐波)。一旦信号被剪切,它就会永远改变 - 无法恢复原始信号。


6.jpg

当信号接近限幅点时,模拟系统开始逐渐将信号四舍五入到限幅点。相比之下,数字系统通常更加突然地剪切信号,允许信号以其自然速率增加,直到它到达剪切点。出于这个原因,模拟削波被认为比数字削波更宽容或“更不刺耳”。这种评估有些正确,但在混合和录制音频的过程中,尽可能完全避免剪辑(模拟和数字)。

如何避免剪裁

避免削波通常是确保沿音频信号链正确设置所有设备的问题。这包括从麦克风(或其他声源)到记录介质和/或扬声器的所有内容。

为避免剪裁,必须:

1.    了解您正在处理的信号的RMS电平和动态范围,以及

2.    选择和设置设备,为这些信号提供足够的空间。

简而言之,如果任何一台设备的电平超过了限幅点,请将信号向下转,直到峰值始终低于限幅点。

这听起来很简单,但还有一些其他问题需要考虑。

1.    “ 当我调低音量以避免削波时,部分音频现在太安静了,无法听到。”

2.    “ 领奖台上的第一位演讲者很好,但下一位演讲者声音更大,导致剪辑。”

3.    “ 在声音检查期间,水平很好,但在演出期间,一切都在某种程度上更响亮,导致剪辑。”

在第一种情况下,调低电平以避免削波不仅会影响信号的峰值(响亮部分),还会降低信号较安静部分的电平。这可能意味着某些较为安静的词性变得听不见,或者某些低水平混合的乐器不再被听到。您可以在多大程度上降低音量,并且仍然可以清晰地听到音频的所有部分。

第二种情况说明信号可能不会随着时间的推移而保持不变 - 尤其是在舞台上更换扬声器或舞台上的乐队时。在这些情况下防止削波的快速解决方法是在演奏期间调整音量以适应讲台上的新扬声器,但这是一种反应性和不切实际的解决方案,需要您在对信号进行这样的调整之前已经录制了音频。

第三种情况类似于第二种情况,主要区别在于:领奖台上只有一个乐队或演讲者。然而,即使在讲台上只有一个人或团体,他们的声音水平也可能在整个事件中发生变化。扬声器(或乐队)通常会在演讲/演奏过程中平静地开始并变得更加生动,从而导致RMS和峰值水平大幅提升。再一次,在这一刻调整这种情况并不是一个很好的解决方案。当您意识到需要关闭信号时,已经发生削波。

幸运的是,有一些信号处理技术可以帮助解决这些问题。

信号处理

可以部署硬件和软件效果来塑造音频信号,为您的观众提供更清晰,更悦耳的声音,并确保您的设备免受破坏性信号的影响。

三种最常见的信号处理效果是:

1.    均衡器

2.    压缩器

3.    限制器

均衡器

到目前为止,在本文中,我们只关注调整整个音频信号的电平。均衡器是有意地以不同的量调整音频信号的不同频率的设备(硬件或软件)。

均衡器(或通常称为EQ)用于增强信号质量并解决诸如反馈之类的特定问题。

EQ的目的是“塑造”信号的声音,包括调整各种频率范围内的电平,不调整信号的整体(RMS)电平,也不会显着影响其动态范围。

音频混音器具有一些EQ功能是很常见的。这些功能可能包括输入高通滤波以及低频,中频和高频范围电平调整。专用均衡器通常提供更详细的控制,提供更多频段。

像本文中的许多主题一样,整本书都是关于均衡的。本文仅提及EQ,以便从其他信号处理硬件/软件(如压缩器和限制器)中进行清晰定义。

压缩器

压缩器用于降低音频信号的动态范围。我们的想法是减少最响亮的峰值并轻推最安静的部分,以创建一个变化不大的信号。您必须巧妙地应用此效果,因为信号水平的峰值和谷值是听觉体验的重要部分。您只想将这些峰和谷驯服到所需的程度,以提供听起来舒服且相对容易处理的信号。

对于直播或室内现场体验,压缩需要实时应用,并且通常使用专用设备实施。但是,如果您的观众只能听到录制的音频副本,那么通常最好不进行压缩录制(留下大量空间以避免任何剪辑),然后在后期制作阶段应用压缩。最近从16位模拟到数字(A / D)转换到24位A / D转换的转变意味着您可以非常保守水平(留下大量空间)并且仍然具有非常完整和动态的信号用于发布-生产。

限制器

许多人将压缩机与限制器混淆,但实际上它们对于不同的目的具有不同的效果。限制器旨在限制音频信号的峰值电平。与压缩不同,它不是为了减少动态范围,而是为了防止偶然的大峰通过系统进入放大器和/或扬声器。在大多数音频设置中,限制器紧接在信号链中的压缩器之后。

您可以将限制器视为“受控剪切”功能。它的工作是识别肯定会被剪切的信号(例如放大后进一步向下),并尽可能优雅地修剪它们。理想情况下,信号链中此点不会有任何大信号峰值,但实际上很难完全防止这种峰值偶尔发生 - 限制器用于预测这些峰值。

限制器主要用于保护下游设备(放大器和扬声器)免受破坏信号电平的影响。它不用于增强信号(与压缩和均衡器不同),而是在绝对必要时以受控方式降级信号。

放大器

在将信号施加到扬声器之前,音频放大器用于将音频信号从前面提到的“信号处理”电平(例如+4 dBu)增加到更高的电平。音频放大器的目标是产生一个输出信号,该信号与幅度以外的所有区域的输入信号相匹配。在信号链的混合,EQ,压缩和限制阶段的上游执行音频信号形状或内容的所有有意修改。

输入/输出规格

每个信号处理装置(例如混频器,编码器,记录器,放大器)都为其音频输入/输出端口指定了一系列可接受的信号电平。这些级别规范使用户能够确定这些信号处理设备可以轻松连接在一起,以创建高质量的信号处理链。

理想情况下,一台设备的输出规格将与下一个下游齿轮的输入规格完美对齐,但实际情况并非总是这样。因此,用户需要了解这些规范并确定任何规范不匹配以及如何最好地纠正它们。

虽然未明确说明,但输入和输出规范通常对1 KHz正弦波测试信号(用于测试音频信号的人工创建的声音)有效。

输入规格

输入规范通常采用最大信号限制的形式,并指定可能连接到输入端口的内容。这些规范还可以包括可用于将输入信号调整到理想/标称电平的输入衰减或增益量。

最大信号限制表示输入信号发生失真(削波)的点。该限制可以根据电压(RMS,峰值,峰峰值)或dBu来指定。

输出规格

输出规格通常采用两个值的形式:标称输出和最大输出。标称输出是仪表读数为0 VU时信号的RMS(平均值)。最大输出表示信号在开始失真(剪辑)之前可以达到的最高值。

测光

模拟仪表

模拟仪表通常被称为“ VU仪表 ”,并通过显示信号的RMS值来提供信号响度的一般感觉。这些仪表设计为具有缓慢的攻击和增益,因此它们不响应短期峰值,而是表示较长期的平均值。

理想值位于秤的中心位置(0 VU点),仪表上的所有其他点以dB为单位表示。最好操作设备,使输入和输出信号调整到非常接近0 VU点。您的设备将在此级别内发挥最佳功能。

7.jpg

彩色灯用于提供仪表的简单视觉读数。绿色表示等于或低于0 VU点的电平,黄色表示显着高于0 VU点的电平,红色表示非常接近削波的电平。在理想的设备操作下,绿灯保持稳定,第一个黄灯或两灯偶尔亮起。

数字仪表

数字仪表有时也被称为VU仪表,但它们的组织方式与模拟仪表的不同。

数字仪表的刻度将0置于最顶部,这表示剪切点。与模拟VU表不同,其中0是信号电平目标,使用数字表,您将希望保持您的电平远离0。

8.jpg

数字仪表上使用的单位是dBFS(相对于满量程的dB)。仪表上的所有其他点表示满量程(削波点)以下的dB数。与模拟仪表类似,绿色,黄色和红色灯用于轻松读取当前信号电平。

·         绿色通常保留用于-18 dBFS或更低的信号,

·         黄色表示-9 dbFS和-18 dBFS之间的信号

·         红色表示高于-9 dBFS的信号。

数字仪表响应可以有很大差异。与模拟VU仪表一样,数字仪表提供慢速响应以反映平均值。还有峰值表,显示当前峰值,准峰值表,提供峰值和长期平均值之间的平衡。应该注意的是,很少的米显示绝对或真实的峰值,因此应该谨慎以避免数字削波。

在某些情况下,使用单独的LED指示已发生削波。虽然这不能反映信号被削减的严重程度(持续时间和数量),但它仍然是一个非常方便的指标。

模拟/数字仪表校准

当使用模拟设备(例如混合器)为数字设备(例如编码器/记录器)供电时,您希望将模拟仪表的输出(理想情况下为0 VU)与数字仪表上的大约-18 dBFS对齐。这是设置的良好起点,然后您可以使用仪表进行监控,以确保您有适当的信号余量。

已经施加压缩的信号(例如,掌握的音乐)通常比实况音乐信号需要更少的净空。然而,对于现代数字设备,试图将余量限制在信号严格要求的范围内几乎没有收获; 最好是安全地玩,尽可能留下比必要的更多的净空高度。

9.jpg

示例场景

让我们回到示例场景,并将一些信息付诸实践。

回顾:你已被聘请录制和播放现场活动,这是一个民谣歌手弹吉他。表演者已经有一个模拟调音台,您将从中收到音频输入。

模拟混频器的规格如下:

1.    0 VU = +4 dBu

2.    最大输出= 21 dBu

您正在使用的数字录音机上的模拟音频输入规格是:

1.    最大输入电平= 0.707 V RMS

2.    输入增益调整= 0至30 dB

您需要做的第一件事是将数字录音机上的输入规格转换为以dBu表示,以便您可以将其与模拟混音器预期接收的电平进行比较。这可以通过上面提供的公式或使用任意数量的在线转换器来完成。

最大输入(dBu)= 20 * log(0.707 / 0.775)= -1 dBu

在比较数字重新编码器的最大输入规格(-1 dBu)和模拟混频器的预期输出电平(+4 dBu)时,我们可以看到我们遇到了问题。混频器的RMS输出预计为+4 dBu,高于录像机的最大输入规格。直接将此信号输入到录像机将导致削波,因为录像机的信号太高(太热)。为了解决这个问题,我们需要在模拟混音器输出和录音机输入之间插入一个衰减器(有时也称为衰减器或衰减器)。这使我们能够将来自调音台的信号电平降低到更适合录音机的水平。

下一步是计算需要多少衰减。为此,我们需要知道我们的信号需要多少空间。有了民谣歌手和他的原声吉他,我预计会有15分贝的空间。为了获得15 dB的裕量,我们对录像机的模拟音频输入需要比-1 dBu的最大输入规格低15 dB。换句话说,输入必须低于-16 dBu。因此,衰减器需要将混频器输出信号降低约20dB。我们可以选择一个20 dB衰减器,但我建议留一点余量并选择一个25 dB衰减器。25 dB衰减器将混频器输出电平降至-21 dBu。然后我们将录音机中的输入增益调整设置为+5 dB 将信号电平提升到我们想要的-16 dBu。

10.jpg

我们现在设置为在数字录音机的音频信号上有15 dB的余量。虽然这个级别应该足够多,但选择比我们要求的稍大的衰减器会给我们一些额外的余量,以防我们发现我们需要超过15 dB的余量(这就是声音检查的目的)或者如果水平来自混频器略高于0VU(+4 dBu)。如果是这种情况,我们只需重新调整数字编码器的输入增益即可。

摘要

熟悉音频信号的性质(RMS +动态范围)以及与之相关的各种测量单位,您可以读取和解释音频设备输入/输出规格,并确定如何设置数字录音机以确保最佳质量录音可能。您还可以使用正确的术语与音频专业人士交谈,并了解要询问的问题,以确保他们为您提供的音频信号没有任何意外。


电话:010-82609286/87/88/89传真转888,技术咨询:010-82609289转827/833 邮箱:info.bj@exntech.com

Copyright 2018@宇诚互联(北京)科技有限公司.All rights reserved. 京ICP备18058907号

宇诚科技视频采集卡厂家为您提供最权威的VGA采集卡,DVI采集卡,HDMI采集卡,4K采集卡,高清采集卡,Pearl录播一体机,便携式录播,

屏幕采集卡,图像采集卡,视频编码器,视频转换器,osprey流媒体卡,外置USB采集盒采集卡系列最全设备,进口品质有保证,是您购买首选。

视频采集卡 图像采集卡 屏幕采集卡 视频编码器 视频采集器 直播编码器 视频转换器 视频压缩卡 网络直播 视频卡 采集卡 HDMI采集卡

视频采集器_HDMI采集卡_采集卡驱动_视频采集软件_采集卡厂家-宇诚科技官网