2주차. 소리의 개념
소리가 만들어지고 전달되고 지각되는 원리와, 음향·아날로그·디지털 도메인의 기초 개념을 학습합니다.
학습 목표
- 주파수·진폭·위상·음색의 개념을 설명한다
- 청각의 물리적 과정과 무의식적·의식적 처리의 차이를 이해한다
- 음향·아날로그·디지털 도메인의 차이와 연결 관계를 설명한다
목차
소리는 무엇으로 이루어져 있는가?
오늘날 우리는 컴퓨터가 디지털 오디오를 재생하고 녹음하는 일을 너무도 자연스럽게 여깁니다. 디지털 오디오는 컴퓨터가 소리를 다루는 방식이지만, 그 뒤에는 생각보다 많은 원리가 숨어 있습니다. 디지털 오디오를 깊이 이해할수록 기술에 끌려다니기보다, 기술을 더 정확하고 유연하게 활용할 수 있게 됩니다.
디지털 오디오를 제대로 이해하려면, 먼저 소리가 어떻게 만들어지는지부터 출발해야 합니다. 우리 주변에는 공기 분자들이 가득하고, 소리는 그 공기 분포가 흔들릴 때 생깁니다. 예를 들어 손뼉을 치면, 손이 맞닿는 순간 주변 공기 분자에 갑작스러운 압력 변화가 생기고, 그 변화가 음파가 되어 퍼져 나갑니다.
👏 실습도구 01
공기 분자 진동 시뮬레이션
박수를 치면 공기 분자가 진동하며 음파가 퍼져나가는 과정을 관찰하세요. 캔버스를 클릭하면 해당 위치에서 음파가 발생합니다.
캔버스를 클릭하면 해당 위치에서 음파가 발생합니다.
여기서 중요한 점은, 분자 자체가 파동을 따라 이동하는 것은 아니라는 것입니다. 파동은 공기 속 분자들이 서로 충돌하며 만들어내는 움직임의 패턴으로 이루어집니다. 또 소리는 공기뿐 아니라 고체, 액체, 기체 등 어떤 매질에서도 전달될 수 있습니다. 예를 들어 고래의 울음소리는 바닷물 속을 통과해 전달되고, 기차 선로 같은 고체를 따라서도 소리가 전달될 수 있습니다. 이러한 고체, 액체, 기체는 모두 음향 영역에 속하며, 이 영역 안에서 음향 에너지 파동, 즉 소리가 이동합니다.


손뼉 소리는 짧고 단발적인 소리입니다. 하지만 기타 줄처럼 지속적인 소리를 생각해 보면 조금 다른 모습이 보입니다. 줄의 물리적 성질 때문에 줄은 일정한 비율로 앞뒤로 진동하고, 그 결과 공기 분자에도 규칙적인 압력 변화가 생깁니다. 우리는 이런 규칙적인 진동을 지속적인 소리, 더 나아가 하나의 음정으로 인식합니다.
🎸 실습도구 02
지속되는 소리 시뮬레이션
기타 줄을 튕기면 공기 분자들이 규칙적으로 진동하며 지속적인 음파가 퍼져나가는 과정을 관찰하세요.
기타 줄을 튕겨 지속되는 진동이 어떻게 전달되는지 관찰하세요.
다시 말해, 각각의 공기 분자가 파동과 함께 이동하는 것이 아니라, 분자들이 서로 충돌하는 패턴이 유지되면서 파동이 전파되는 것입니다. 이것은 경기장에서 사람들이 자리에서 조금씩 일어나고 앉으며 만드는 ‘웨이브’와 비슷합니다. 개개인은 제자리에서 조금씩만 움직이지만, 전체적인 파동은 훨씬 더 크고 경기장 전체를 돌아갑니다.
🏟 실습도구 03
스타디움 파도타기 시뮬레이션
사람들은 자기 자리에서 일어났다 앉을 뿐인데, 파도 모양은 경기장 전체를 이동합니다. 소리도 이와 같은 원리로 전달됩니다.
파도타기를 재생하면 사람들이 제자리에서만 움직이지만 파형은 옆으로 전달됩니다.
귀와 마이크는 바로 가까운 곳의 작은 공기 분자 집단이 어떻게 움직이는지를 감지하여 소리를 받아들입니다. 이 움직임의 패턴을 추적하고 다시 만들어내는 것이 모든 음향 녹음의 기초입니다. 따라서 소리를 디지털로 녹음하고 재생하려면, 이 패턴을 숫자로 어떻게 측정하고 기술할 수 있는지를 이해해야 합니다.
주파수와 진폭
소리를 이해할 때는 보통 주파수, 진폭, 음색이라는 세 가지 축으로 나누어 생각하면 편합니다. 여기서는 먼저 그중 수치로 가장 직접적으로 다룰 수 있는 주파수(frequency)와 진폭(amplitude)을 살펴보겠습니다.
가장 단순한 형태의 소리인 사인파(sine wave)는 한 번에 하나의 주파수만 가집니다. 우리는 이 주파수를 낮은 음에서 높은 음까지 이어지는 스펙트럼 속의 음높이(pitch)로 지각합니다. 주파수와 피치라는 말을 서로 바꾸어 쓰는 경우도 있지만, 보통 피치는 음악적인 맥락에서 쓰이고, 주파수는 파동이 초당 몇 번 반복되는지를 뜻하는 보다 직접적인 물리량입니다.
이것은 음속과는 다릅니다. 바닷가에서 파도가 해변에 밀려오는 모습을 생각해 보면, 파도가 얼마나 빨리 이동하는지를 측정할 수도 있고, 파도가 얼마나 자주 도착하는지를 측정할 수도 있습니다. 예를 들어 파도가 1초마다 한 번씩 해변에 도달한다면, 주파수는 초당 1회입니다. 소리도 이와 마찬가지로, 특정 지점에서 공기 압력이 얼마나 자주 높아지고 낮아지는지를 초당 반복 횟수로 측정합니다. 이 단위를 헤르츠(hertz, Hz)라고 합니다.
🌊 실습도구 04
해변 파도와 주파수
파도가 해안에 얼마나 자주 도착하는지가 주파수입니다. 속도를 바꿔도 주파수(도착 빈도)는 변하지 않는 것을 확인해 보세요.
시간에 따라 특정 지점의 공기압이 어떻게 변하는지를 그래프로 그리면 소리의 형태를 어느 정도 시각적으로 이해할 수 있습니다. 주파수가 높은 소리는 공기압의 변화가 더 자주 일어나고, 주파수가 낮은 소리는 공기압의 변화가 더 천천히 일어납니다.
📊 실습도구 05
주파수와 압력 변동
주파수 슬라이더를 움직여 관측 지점에서의 압력 변동을 확인하세요.
오실로스코프(oscilloscope)에서는 보통 가로축이 시간을, 세로축이 파형의 위아래 움직임, 즉 진폭 변화를 나타냅니다. 따라서 같은 시간 구간 안에서 더 많은 반복이 보이면 주파수가 더 높은 것이고, 위아래 폭이 더 크면 진폭이 더 큰 것입니다.
이제 실제로 몇 가지 주파수의 소리를 들어보겠습니다. 아래 오실로스코프에서 각 버튼을 눌러 100Hz, 1kHz, 5kHz 사인파의 소리와 파형을 비교해 보세요. 주파수가 높아질수록 파형이 더 빽빽해지는 것을 확인할 수 있습니다. 작은 스피커에서는 100Hz 같은 낮은 톤이 충분히 재생되지 않을 수 있으므로, 필요하면 헤드폰으로 비교해 보는 것이 좋습니다.
🔊 실습도구 06
주파수별 파형 비교
주파수를 선택하고 재생 버튼을 눌러 소리와 파형을 확인하세요.
모든 음악적 음에는 기본 주파수(fundamental frequency)가 있습니다. 악기와 목소리는 각기 낼 수 있는 음역대가 다르기 때문에, 높은 소리를 내는 악기는 더 높은 기본 주파수를 가지게 됩니다.
🎹 실습도구 07
악기 기본 주파수 대역
각 악기가 대체로 어떤 기본 음역을 가지는지 비교해 보세요. 같은 음정 계열이라도 악기에 따라 낼 수 있는 범위가 다릅니다.
앞서 본 사인파는 한 가지 주파수만 가진 가장 단순한 소리입니다. 반면 실제 악기 소리는 음높이를 정하는 기본 주파수 외에도 여러 배음(harmonic frequencies)을 함께 포함합니다. 그래서 사인파는 가장 단순한 순수음(pure tone)에 가깝고, 우리가 일상에서 듣는 대부분의 소리는 여러 주파수 성분이 겹쳐진 복합음(complex sound)이라고 할 수 있습니다. 이런 추가 성분들이 소리의 음색(timbre)을 만들기 때문에, 같은 음정을 내도 악기나 목소리에 따라 전혀 다르게 들립니다.
여기서 기억해야 할 것은, 파동의 주파수가 얼마이든지 간에 소리 자체는 같은 속도로 움직인다는 점입니다. 즉, 소리는 음속으로 이동합니다. 다만 음속은 어떤 매질을 통과하느냐에 따라 달라집니다. 평균적인 온도와 습도의 공기 중에서는 초속 약 340미터 정도이며, 물속에서는 이보다 4배 이상 빠르고, 철 같은 고체에서는 15배 이상 빠르게 이동합니다.
💨 실습도구 08
매질별 음속 비교
주파수가 달라도 같은 매질 안에서는 같은 속도로 전달됩니다. 매질을 바꿔보세요.
반면 진폭(amplitude)은 파동이 얼마나 자주 움직이는지가 아니라, 얼마나 크게 움직이는가를 나타냅니다. 진폭이 작으면 조용한 소리이고, 진폭이 크면 큰 소리입니다. 다시 말해, 큰 소리는 더 높은 진폭을 가진 파동이고, 작은 소리는 더 낮은 진폭을 가진 파동입니다.
📢 실습도구 09
진폭별 파형 비교
진폭(Amplitude)은 파형의 크기를 나타냅니다. 진폭이 클수록 큰 소리가 납니다.
진폭은 공기압의 변화량이라고 생각해도 좋습니다. 기압계(barometer)는 특정 공간에서 공기 분자들이 평균적으로 얼마나 밀집해 있는지를 측정하며, 일반적으로 파스칼(pascal) 단위를 사용합니다. 기압 자체는 고도나 날씨 같은 조건에 따라 달라질 수 있지만, 소리에서 더 중요한 것은 그 절대값보다 평균값을 기준으로 공기압이 얼마나 흔들리는가입니다.

소리에서 중요한 것은 절대적인 기압값이 아니라, 그 값이 얼마나 변하느냐입니다. 예를 들어 귀 근처의 공기압이 평균값에서 거의 변하지 않으면 우리는 침묵을 듣습니다. 반대로 아주 미세한 변화만 있어도 겨우 들을 수 있는 작은 소리가 생기고, 200파스칼 정도까지 흔들리면 제트엔진 가까이에서처럼 매우 크고 고통스러운 소리가 됩니다. 기준을 어디에 두느냐에 따라 표현 수치는 조금 달라질 수 있지만, 핵심은 인간이 다루는 음량 범위가 수백만 배 이상의 엄청난 차이를 가진다는 점입니다.
| 상황 | 압력 변동 |
|---|---|
| 제트 엔진 (약 23m 거리) | 200 Pa |
| 대형 콘서트 | 20 Pa |
| 전기톱 | 3.6 Pa |
| 번화한 거리 | 0.2 Pa |
| 속삭임 | 0.0063 Pa |
| 조용한 대화 | 0.002 Pa |
| 조용한 녹음실 | 0.00035 Pa |
| 청력 역치 (겨우 들리는 소리) | 0.00002 Pa |
사람이 들을 수 있는 진폭의 범위는 매우 넓기 때문에, 이를 다루기 쉬운 형태로 표현하려고 로그 스케일(logarithmic scale)을 사용합니다. 이 방식에서는 공기압 변화가 배수로 커져도 수치는 비교적 다루기 쉬운 간격으로 늘어납니다. 이때 사용하는 단위가 데시벨(decibel, dB)입니다.
| 소리 | 압력 변동 | 음량 (dB SPL) |
|---|---|---|
| 제트 엔진 (약 23m 거리) | 200 Pa | 140 dB SPL |
| 대형 콘서트 | 20 Pa | 120 dB SPL |
| 전기톱 | 3.6 Pa | 105 dB SPL |
| 번화한 거리 | 0.2 Pa | 80 dB SPL |
| 속삭임 | 0.0063 Pa | 60 dB SPL |
| 조용한 대화 | 0.002 Pa | 40 dB SPL |
| 조용한 녹음실 | 0.00035 Pa | 25 dB SPL |
| 청력 역치 | 0.00002 Pa | 0 dB SPL |
데시벨은 엄밀히 말하면 독립적인 측정 단위라기보다 두 값을 비교하는 로그 비율입니다. 하지만 기준점을 정해 두면 실질적인 측정 단위처럼 편리하게 사용할 수 있습니다. 음향 영역에서는 이 기준을 음압 레벨(Sound Pressure Level, SPL)이라고 표시합니다. 예를 들어 대부분의 사람이 겨우 들을 수 있는 최소 수준을 0dB SPL로 두면, 그보다 훨씬 큰 소리도 비교적 다루기 쉬운 숫자로 표현할 수 있습니다. 제트엔진에 가까운 수준의 매우 큰 소리가 대략 140dB SPL로 표현되는 것도 그 때문입니다.
이 방식의 장점은 다양한 소리를 더 직관적인 숫자로 표현할 수 있다는 점입니다. 조용한 대화는 대체로 40dB SPL, 세탁기는 60dB SPL 정도, 체인소는 105dB SPL 정도가 됩니다. 녹음과 믹싱에서는 일반적으로 신호를 6dB 올리면 진폭이 두 배가 되고, 6dB 줄이면 진폭이 절반이 됩니다. 다른 분야에서는 약간 다르게 계산되기도 하지만, 녹음과 믹싱에서는 이 규칙이 매우 유용합니다.
정리하면, 주파수와 진폭은 소리를 설명하는 가장 기본적인 두 요소입니다. 주파수는 파동이 얼마나 자주 반복되는지를 나타내며 헤르츠 단위로 측정하고, 진폭은 파동이 얼마나 강하게 움직이는지를 나타내며 데시벨을 통해 기준점에 대한 상대값으로 표현합니다. 화면으로 볼 때도 같은 원리가 적용되어, 진폭이 큰 소리는 세로 방향으로 더 크게 보이고, 주파수가 높은 소리는 같은 가로 구간 안에 더 많은 반복이 들어가게 됩니다.
📐 실습도구 10
주파수와 진폭 비교
주파수와 진폭이 파형에 어떤 영향을 미치는지 비교해 보세요.
음색
지금까지 살펴본 사인파는 가장 단순한 형태의 소리입니다. 하지만 피아노, 기타, 바이올린 같은 실제 악기 소리는 훨씬 더 복잡합니다. 같은 ‘라’ 음을 연주해도 피아노와 바이올린이 다르게 들리는 이유는 바로 음색(timbre) 때문입니다. 즉, 음색은 같은 음높이와 같은 크기를 가진 소리라도 서로 다른 성격으로 들리게 만드는 요소입니다.
세상의 소리는 음정의 명확성에 따라 크게 세 가지로 나누어 생각할 수 있습니다. 피아노나 바이올린, 플루트처럼 ‘도레미’로 비교적 분명하게 부를 수 있는 소리가 있고, 박수나 스네어 드럼, 바람 소리처럼 특정한 음높이를 잡기 어려운 소리가 있습니다. 또 종소리나 팀파니, 마림바처럼 음정이 전혀 없는 것은 아니지만 어딘가 복잡하고 퍼져 있는 듯 들리는 소리도 있습니다. 이 차이를 이해하려면 소리를 구성하는 내부 성분을 살펴봐야 합니다.
아무리 복잡한 소리라도 결국은 여러 개의 사인파 성분이 합쳐진 것으로 볼 수 있습니다. 이 각각의 성분을 부분음(partial)이라고 합니다. 부분음 가운데 가장 낮은 주파수를 가진 성분은 기음(fundamental)이며, 우리가 인식하는 기본적인 음높이를 결정합니다. 그리고 기음을 제외한 더 높은 성분들을 통틀어 상음(overtone)이라고 부릅니다.
상음은 다시 두 부류로 나눌 수 있습니다. 기음의 2배, 3배, 4배처럼 정수배 관계에 있는 성분은 배음(harmonics)이고, 정수배 관계에 있지 않은 성분은 비배음(inharmonics)입니다. 음정이 분명한 악기 소리는 대체로 배음 구조가 잘 정리되어 있습니다. 예를 들어 기음이 100Hz라면 200Hz, 300Hz, 400Hz처럼 정수배 성분이 함께 울리며, 우리 귀는 이 질서 있는 관계를 하나의 안정된 음높이로 묶어서 인식합니다. 같은 음높이라도 악기마다 각 배음의 세기가 다르기 때문에 음색이 달라집니다. 결국 복합적인 파형은 여러 부분음이 더해진 결과이며, 어떤 부분음이 얼마나 강하게 섞이느냐에 따라 파형의 모양도 달라지고, 우리가 느끼는 질감도 달라집니다.
🎛 실습도구 11
기음과 배음으로 만드는 음색 합성기
기음 주파수와 각 배음의 진폭을 조절해 보세요. 같은 음높이라도 배음 구조가 바뀌면 파형, 스펙트럼, 스펙트로그램, 그리고 실제로 들리는 음색이 함께 달라집니다.
- 기음 · 220 Hz · 진폭 100%
- 2배음 · 440 Hz · 진폭 72%
- 3배음 · 660 Hz · 진폭 42%
- 4배음 · 880 Hz · 진폭 22%
- 5배음 · 1.10 kHz · 진폭 12%
- 6배음 · 1.32 kHz · 진폭 6%
- 7배음 · 1.54 kHz · 진폭 4%
- 8배음 · 1.76 kHz · 진폭 3%
- 9배음 · 1.98 kHz · 진폭 2%
- 10배음 · 2.20 kHz · 진폭 1%
또 종소리나 팀파니처럼 음정이 어느 정도 느껴지지만 동시에 복잡한 울림이 큰 소리는 비배음 성분을 많이 포함하는 경우가 많습니다. 이 비배음들은 기음과 완전히 정렬되지 않기 때문에 소리에 독특하고 풍부한 울림을 더하면서도 음정을 조금 흐리게 만듭니다. 같은 금속 타악기라도 종은 기음이 어느 정도 유지된 채 비배음이 울림을 더하는 경우가 많고, 심벌즈는 비배음이 너무 많고 복잡해서 기음 자체를 잡기 어려운 경우가 많습니다.
🔔 실습도구 12
비배음을 포함한 음정성 음색 비교
팀파니와 종소리처럼 기음은 느껴지지만 부분음의 일부가 정수배에서 벗어난 소리를 비교해 보세요. 프리셋을 바꾸면 부분음의 비율과 기본 진폭 배열이 함께 달라집니다.
기음은 들리지만 일부 부분음이 정수배에서 벗어나, 울림이 넓고 둥글게 퍼지는 타악기성 음색
- 기음 · 1.00× · 220 Hz · 진폭 100%
- 부분음 2 · 1.50× · 330 Hz · 진폭 42%
- 부분음 3 · 2.00× · 440 Hz · 진폭 30%
- 부분음 4 · 2.44× · 537 Hz · 진폭 32%
- 부분음 5 · 3.00× · 660 Hz · 진폭 18%
- 부분음 6 · 3.95× · 869 Hz · 진폭 10%
반대로 박수, 바람, 스네어 드럼 같은 소리는 특정 기음이 두드러지지 않고, 많은 주파수 성분이 불규칙하게 섞여 있습니다. 이런 소리는 뚜렷한 음높이보다 질감과 에너지감으로 인식되며, 흔히 노이즈(noise) 계열의 소리라고 설명할 수 있습니다. 음정이 분명한 소리, 음정이 흐리지만 어느 정도 남아 있는 소리, 그리고 사실상 음정보다 잡음 성격이 더 강한 소리를 구분해 들어보는 습관은 음색을 이해하는 데 큰 도움이 됩니다.
🌬 실습도구 13
노이즈 계열 음색 비교
바람 소리, 박수 소리, 스네어 드럼 소리를 직접 들어보세요. 세 소리는 모두 넓은 주파수 대역의 노이즈 성분이 강하며, 뚜렷한 기음보다는 질감과 에너지감이 중심이 됩니다.
- • 바람 소리: 지속형, 부드러운 광대역 노이즈
- • 박수 소리: 매우 짧은 충격성 노이즈 버스트
- • 스네어 드럼: 짧은 노이즈 + 약한 톤 성분의 결합
이처럼 음색은 소리에 어떤 주파수 성분이 들어 있는지, 그리고 그 성분들이 얼마나 강한지에 따라 달라집니다. 사람의 뇌는 바로 이런 배음과 부분음의 패턴을 바탕으로, 같은 높이의 음이라도 그것이 플루트인지 바이올린인지, 혹은 사람 목소리인지 다른 소리인지를 구분합니다. 오실로스코프가 시간에 따른 진폭 변화를 보여주는 도구라면, 스펙트럼 애널라이저(spectrum analyzer)는 한 순간에 어떤 주파수들이 얼마나 포함되어 있는지를 보여주는 도구입니다. 또한 스펙트로그램(spectrogram)은 시간의 흐름에 따라 주파수 분포가 어떻게 변하는지를 함께 보여줍니다. 따라서 음색을 이해한다는 것은 단순히 ‘소리가 밝다, 어둡다’고 느끼는 데서 그치지 않고, 그 소리를 구성하는 주파수들의 구조를 읽는 일과도 연결됩니다.
위상과 시간
파동의 주파수가 높을수록 1초 동안 더 많은 주기를 반복하게 되며, 따라서 각 주기의 길이는 더 짧아집니다. 파장(wavelength)은 이 한 주기의 길이를 의미합니다. 가장 단순한 사인파 한 주기를 보면, 처음 상승하여 정점에 도달하고, 다시 하강해 바닥을 지나 출발점으로 돌아오는 과정이 하나의 주기입니다.
오실로스코프에서 보았듯이, 가로축은 시간을, 세로축은 공기압을 나타냅니다. 사인파는 시간이 흐르면서 양의 진폭과 음의 진폭 사이를 부드럽게 오가며 진동합니다. 이 진동은 원의 각도처럼 0도, 90도, 180도, 270도, 그리고 다시 360도(또는 0도)로 측정할 수 있습니다. 이 그래프는 시간에 따른 파형의 위상(phase)도 함께 보여 줍니다. 여기서 위상이란, 현재 파동이 한 주기 안에서 어느 위치에 있는지를 뜻합니다.
🌀 실습도구 14
위상과 시간의 관계 보기
원 위의 각도와 오실로스코프 파형상의 위치를 함께 보면서, 위상이 한 주기 안에서 어디를 가리키는지 확인해 보세요. 한 점이 원을 한 바퀴 도는 과정이 사인파 한 주기와 대응됩니다.
하지만 더 흥미로운 것은 두 개 이상의 소리가 서로 어떤 상대적 위상 관계를 가지는가입니다. 두 개의 음파를 합치면 새로운 형태의 파동이 만들어집니다. 예를 들어 완전히 동일한 두 소리를 서로 섞는다고 해 봅시다. 이 둘이 어떻게 합쳐지는지는 서로의 타이밍, 즉 상대적 위상에 달려 있습니다.
만약 두 파형의 위아래 움직임이 정확히 맞아떨어지면 완전히 동위상(in phase) 상태가 되며, 결과적으로 소리는 두 배 더 크게 들립니다. 반대로 하나의 파형이 올라갈 때 다른 파형이 내려가도록 완전히 반대 방향으로 정렬되어 있으면, 두 소리는 서로 상쇄되어 완전한 침묵이 됩니다. 상대적 위상이 그 중간 어디쯤에 있으면, 일부는 강화되고 일부는 상쇄됩니다.
〰️ 실습도구 15
상대 위상에 따른 합성과 상쇄
같은 주파수의 두 사인파를 겹쳐 보면서, 상대 위상이 맞을 때는 얼마나 커지고 반대일 때는 얼마나 상쇄되는지 확인해 보세요.
완전 동위상: 두 파형이 같은 방향으로 움직여 가장 크게 합쳐집니다.
- • 기준 주파수: 220 Hz
- • 합성 peak: +2.00
- • 상대 크기: 1.00
주파수가 다른 파형들을 합칠 때는 더욱 흥미로운 일이 벌어집니다. 예를 들어 250Hz 사인파와 1600Hz 사인파를 합치면 둘의 특징을 동시에 가진 더 복잡한 파형이 됩니다.
🎛️ 실습도구 16
서로 다른 주파수의 파형 합성
250Hz와 1600Hz 사인파를 따로 보고, 함께 섞었을 때 합성 파형이 어떻게 더 복잡해지는지 확인해 보세요.
- • 낮은 주파수는 큰 윤곽을 만듭니다.
- • 높은 주파수는 세부적인 잔물결을 더합니다.
- • 두 파형이 합쳐지면 더 복잡한 파형이 됩니다.
그런 다음 이 복합 파형을 두 개 복사해 서로 타이밍을 약간 바꾸어 섞으면, 각 주파수 성분이 서로 다른 방식으로 강화되거나 상쇄됩니다. 이를 콤 필터링(comb filtering)이라고 하며, 복합적인 소리를 지연된 복사본과 섞을 때 어떤 주파수는 사라지고 어떤 주파수는 더 강조되는 현상을 말합니다. 실제 녹음에서는 같은 음원을 두 개 이상의 마이크로 동시에 받을 때 이런 현상이 자주 생기며, 마이크 간 거리 차이가 미세한 시간차로 바뀌어 음색을 얇게 만들거나 특정 대역을 비정상적으로 강조할 수 있습니다.
🪮 실습도구 17
콤 필터링의 기본 원리
복합 파형을 지연된 복사본과 섞어 보면서, 어떤 주파수는 강화되고 어떤 주파수는 약해지는 콤 필터링의 원리를 확인해 보세요.
- • 첫 감쇠 지점(notch): 625 Hz
- • 첫 강화 지점(peak): 1.3 kHz
- • 250 Hz 반응: 1.62
- • 1600 Hz 반응: 1.27
다양한 소리에 콤 필터링을 적용하여 그 효과를 직접 들어보고, 스펙트럼 애널라이저와 스펙트로그램에서 어떤 주파수가 상쇄되고 보강되는지 확인해 보세요.
🎚️ 실습도구 18
다양한 소리에 적용해 보는 콤 필터링
서로 다른 종류의 소리에 같은 콤 필터를 적용해 보세요. 소리의 종류가 달라도 특정 주파수는 약해지고, 다른 주파수는 도드라지는 변화를 스펙트럼과 스펙트로그램에서 확인할 수 있습니다.
가볍고 밝은 음악입니다. 콤 필터가 걸리면 중고역의 반짝임과 악기 분리가 어떻게 달라지는지 듣기 좋습니다.
- • 첫 감쇠 지점(notch): 417 Hz
- • 첫 강화 지점(peak): 833 Hz
- • 상태: 오디오를 선택하고 재생해 보세요.
또 하나 중요한 점은, 같은 소리 두 개를 완전히 같은 타이밍에 두고 그중 하나를 뒤집으면 역시 완전한 상쇄가 일어난다는 것입니다. 많은 사람이 이것을 ‘위상이 뒤집혔다’라고 말하지만, 엄밀히 말하면 그것은 정확한 표현이 아닙니다. 위상은 시간 차이이고, 뒤집는 것은 시간 차이가 아니라 파형의 위아래를 바꾸는 일입니다.
🔀 실습도구 19
극성 반전과 완전 상쇄
같은 타이밍의 두 신호 중 하나를 위아래로 뒤집으면, 시간 차이 없이 서로 상쇄될 수 있습니다. 이것은 위상 이동이라기보다 극성 반전의 효과입니다.
완전히 같은 타이밍에서 한쪽 극성만 반전하므로 서로 상쇄됩니다.
- • 기준 주파수: 220 Hz
- • 합성 peak: 0.00
- • 타이밍 차이: 0 ms
즉, 양이 음이 되고 음이 양이 되도록 뒤집는 것은 위상 반전이라기보다 극성 반전(inverting the polarity)이라고 부르는 것이 정확합니다. 특히 이것은 음악 전체처럼 복잡한 파형에서 매우 중요한 구분입니다. 같은 소리를 두 개 복사해 하나를 몇 밀리초 지연시켜 섞으면 전체 소리가 사라지는 것이 아니라 톤이 변하는 콤 필터링이 일어납니다. 그러나 두 소리의 타이밍을 완전히 일치시킨 다음, 그중 하나의 극성을 반전시키면 전체 소리가 완전히 상쇄되어 침묵이 됩니다. 이것이 위상과 극성의 차이입니다.
소리의 시각화
소리를 눈으로 본다는 것은, 귀로 듣는 현상을 그래프와 화면 위의 패턴으로 바꾸어 읽는다는 뜻입니다. 녹음과 믹싱에서는 단순히 귀에만 의존하지 않고, 웨이브폼 뷰어(waveform viewer), 오실로스코프(oscilloscope), 스펙트럼 애널라이저(spectrum analyzer), 스펙트로그램(spectrogram) 같은 도구를 함께 사용합니다. 각각은 같은 소리를 서로 다른 관점에서 보여 주며, 어떤 도구를 보고 있는지에 따라 읽는 방법도 달라집니다.
웨이브폼 뷰어는 무엇을 보여 주는가?
DAW에서 가장 자주 보는 화면은 웨이브폼 뷰어입니다. 이것은 녹음된 오디오 파일 전체를 시간축 위에 펼쳐 보여 주는 화면입니다. 가로축(x축)은 시간이고, 세로축(y축)은 순간적인 신호의 크기, 즉 진폭을 나타냅니다. 화면을 멀리서 보면 노래 전체의 구조, 무음 구간, 큰 소리와 작은 소리의 대비가 먼저 보이고, 확대하면 개별 타격음의 시작점, 호흡, 편집 지점 같은 세부 정보가 보입니다.
웨이브폼 뷰어는 특히 에디팅에서 중요합니다. 어디서 소리가 시작되는지, 어느 구간이 너무 조용한지, 테이크 사이의 간격이 어떤지, 클릭 노이즈나 불필요한 무음이 있는지를 빠르게 찾을 수 있기 때문입니다. 다만 이 화면만 보고는 어떤 주파수가 많은지, 음색이 밝은지 어두운지까지는 정확히 알기 어렵습니다. 즉 웨이브폼은 시간과 레벨의 변화에는 강하지만, 주파수 분포 자체를 자세히 보여 주는 도구는 아닙니다.
📈 실습도구 20
웨이브폼 뷰어
x축은 시간, y축은 진폭입니다. 이 뷰어는 파일 전체를 한 번에 축약하지 않고, 2초 단위 페이지처럼 끊어서 보여 줍니다. 재생이 진행되면 현재 재생 위치에 맞춰 다음 페이지로 넘어가므로, 더 세밀한 웨이브폼을 읽을 수 있습니다.
듣기 포인트
밝고 경쾌한 음악으로 전체 구조와 트랜지언트를 관찰하기 좋습니다.
오디오 파형을 불러오는 중...
오실로스코프는 웨이브폼 뷰어와 어떻게 다른가?
오실로스코프도 가로축은 시간, 세로축은 진폭이라는 점에서는 비슷합니다. 하지만 용도는 다릅니다. 웨이브폼 뷰어가 몇 초, 몇 분, 몇 시간짜리 오디오 전체 구조를 보는 도구라면, 오실로스코프는 아주 짧은 시간 안에서 파형이 정확히 어떻게 진동하는지를 확대해 보는 도구입니다.
예를 들어 사인파는 부드러운 곡선으로 보이고, 사각파는 위아래가 급격히 꺾인 형태로 보입니다. 이 화면을 보면 한 주기의 길이, 진동의 반복 속도, 파형의 대칭성, 위상 차이, 극성 반전 여부 등을 직관적으로 확인할 수 있습니다. 두 파형이 얼마나 어긋나 있는지, 서로 더해졌을 때 왜 보강 또는 상쇄가 일어나는지 이해할 때도 오실로스코프가 특히 유용합니다.
〰️ 실습도구 21
오실로스코프
x축은 시간, y축은 진폭입니다. 사인파, 사각파, 톱니파, 삼각파의 모양이 어떻게 다른지 비교해 보세요.
스펙트럼 애널라이저는 무엇을 보여 주는가?
스펙트럼 애널라이저는 소리를 시간축이 아니라 주파수축에서 바라보는 도구입니다. 일반적으로 가로축(x축)은 주파수이며, 왼쪽의 저주파에서 오른쪽의 고주파로 갈수록 음이 높아집니다. 세로축(y축)은 각 주파수 성분의 진폭을 나타내며, 보통 dB 기준으로 표시됩니다.
이 화면에서는 지금 이 순간 어떤 주파수 대역이 강한지 바로 볼 수 있습니다. 예를 들어 킥 드럼은 저역대가 크게 솟아오를 수 있고, 심벌이나 치찰음은 고역대에서 에너지가 두드러질 수 있습니다. 같은 소리를 들어도 귀로는 막연히 "밝다", "답답하다", "거칠다"고 느낄 수 있는데, 스펙트럼 애널라이저는 그 인상을 주파수 분포로 구체화해 줍니다. 그래서 EQ를 걸 때 특정 대역을 찾거나, 공진이 있는 지점, 저역 과다, 고역 부족 같은 문제를 파악할 때 유용합니다.
다만 스펙트럼 애널라이저는 보통 한 순간 또는 매우 짧은 평균 시간의 주파수 분포를 보여 주기 때문에, 시간이 흐르면서 소리가 어떻게 변하는지까지 한 화면에서 길게 읽기는 어렵습니다. 즉 “무엇이 들어 있는가?”를 잘 보여 주지만, “그것이 시간에 따라 어떻게 움직였는가?”는 제한적으로만 보여 줍니다.
📶 실습도구 22
스펙트럼 애널라이저
x축은 주파수, y축은 각 주파수 성분의 진폭을 dB 기준으로 나타냅니다. 재생하면서 어떤 대역에 에너지가 몰리는지 확인해 보세요.
듣기 포인트
밝고 경쾌한 음악으로 전체 구조와 트랜지언트를 관찰하기 좋습니다.
스펙트로그램은 무엇을 보여 주는가?
스펙트로그램은 시간과 주파수를 동시에 보여 주는 도구입니다. 가로축(x축)은 시간, 세로축(y축)은 주파수이며, 각 지점의 색의 밝기와 채도는 그 주파수 성분의 진폭을 나타냅니다. 다시 말해 스펙트럼 애널라이저를 시간 위에 연속적으로 쌓아 놓은 그림이라고 생각하면 이해하기 쉽습니다.
이 도구는 소리의 변화 과정을 읽기에 매우 좋습니다. 어떤 소리가 순간적으로 치고 빠지는지, 배음 구조가 시간이 지나며 어떻게 줄어드는지, 말소리의 포먼트가 어떻게 움직이는지, 잡음이 어느 대역에 길게 깔려 있는지 등을 한눈에 볼 수 있습니다. 예를 들어 박수는 넓은 대역에 짧게 퍼지는 흔적으로 보일 수 있고, 지속음은 특정 주파수 줄무늬가 계속 이어지는 모습으로 보일 수 있습니다.
스펙트로그램은 특히 음색의 시간적 변화, 노이즈의 위치, 자음과 모음의 차이, 공간계 이펙트의 잔향 같은 것을 분석할 때 강력합니다. 대신 처음 보는 사람에게는 색과 패턴이 많아 다소 복잡하게 느껴질 수 있으므로, x축이 시간이고 y축이 주파수라는 점, 그리고 색의 밝기와 채도가 각 주파수 성분의 진폭을 보여 준다는 점을 먼저 기억하고 읽는 것이 좋습니다.
🌈 실습도구 23
스펙트로그램
x축은 시간, y축은 주파수이며, 색의 밝기와 채도는 각 주파수 성분의 진폭을 나타냅니다. 시간에 따른 음색 변화를 관찰해 보세요.
듣기 포인트
밝고 경쾌한 음악으로 전체 구조와 트랜지언트를 관찰하기 좋습니다.
어떤 상황에서 어떤 뷰어를 보면 좋은가?
에디팅 지점을 찾거나 오디오 전체 구조를 파악할 때는 웨이브폼 뷰어가 가장 먼저 도움이 됩니다. 파형의 미세한 모양, 위상 차이, 극성 반전, 반복 주기 자체를 이해하고 싶을 때는 오실로스코프가 적합합니다. 특정 대역이 너무 많은지 적은지, 어느 주파수에 에너지가 몰려 있는지를 보려면 스펙트럼 애널라이저가 좋고, 그 주파수 분포가 시간에 따라 어떻게 변하는지까지 보고 싶다면 스펙트로그램이 가장 많은 정보를 줍니다.
중요한 것은 어느 한 화면만 믿지 않는 것입니다. 같은 소리라도 웨이브폼에서는 트랜지언트가 먼저 보이고, 오실로스코프에서는 파형의 주기와 위상 관계가 보이며, 스펙트럼 애널라이저에서는 대역별 에너지가 드러나고, 스펙트로그램에서는 시간에 따른 주파수 변화가 보입니다. 좋은 엔지니어는 이런 도구를 귀를 대신하는 장치가 아니라, 귀로 들은 인상을 확인하고 더 정확히 해석하기 위한 보조 수단으로 사용합니다.
우리는 어떻게 소리를 듣는가?
우리가 소리를 어떻게 듣는가는 매우 복잡한 과정이며, 지금도 과학은 새로운 사실을 계속 발견하고 있습니다. 여기서는 이 과정을 물리적(physical), 무의식적(subconscious), 의식적(conscious) 세 부분으로 나누어 생각해 보겠습니다.
공기 중의 소리가 귀에 도달하면, 그 소리를 지각하는 첫 단계는 물리적인 과정입니다. 공기압의 변화, 즉 음향적 파동은 귓바퀴(pinnae)에 의해 일부 반사되고 모양이 바뀌며, 외이도를 통해 안쪽으로 전달됩니다. 고막은 이 압력 변화에 따라 진동하고, 그 진동은 이소골(ossicles)이라 불리는 아주 작은 뼈들의 연쇄 운동으로 이어집니다. 이 뼈들은 그 움직임을 기계적으로 증폭해 달팽이관(cochlea) 내부의 액체를 움직이게 합니다.
달팽이관 안에는 수천, 수만 개의 아주 작은 유모세포(hair cells)가 있으며, 각각은 자신의 크기와 강성에 따라 특정한 좁은 주파수 범위에 공명하도록 되어 있습니다. 이 작은 털들은 움직임을 감지하지만, 피부의 털처럼 ‘감각’으로 처리되지 않고 뇌에서 ‘소리’로 처리됩니다.

일반적으로 젊은 사람의 청각 범위는 약 20Hz에서 20,000Hz까지입니다. 하지만 나이가 들수록 고주파 청력이 약해지는 경향이 있습니다. 이는 높은 주파수에 공명하는 유모세포일수록 더 작고 섬세하기 때문입니다. 소리가 클수록 이 털들은 더 많이 흔들리고, 특히 큰 소리에 장기간 노출되면 점차 약해지거나 손상됩니다. 반면 저주파를 담당하는 유모세포는 상대적으로 덜 섬세하기 때문에, 저주파 청력은 비교적 잘 보존되는 편입니다. 중요한 점은 이런 유모세포 손상이 누적되면 다시 되돌리기 어렵다는 것입니다. 그래서 음악 작업에서는 “잘 듣는 것”만큼이나 청력을 보존하는 것도 중요한 기술입니다.
🎹 실습도구 24
청각 범위와 악기 주파수 대역
맨 윗줄은 사람의 대략적인 청각 범위(20Hz~20kHz)입니다. 각 악기는 기본음역과 함께 overtone(배음)이 더 높은 주파수까지 확장될 수 있습니다.
이렇게 귀가 물리적으로 소리를 감지한 뒤에는, 신경 자극이 뇌로 전달되어 처리됩니다. 이 정신적 처리 과정을 연구하는 분야를 정신음향학(psychoacoustics)이라고 합니다. 이 처리 중 일부는 우리의 의식 밖에서 이루어지고, 일부는 의식적인 수준에서 일어납니다.

예를 들어 제가 말하는 단어를 들을 때, 우리는 각각의 소리를 하나하나 의식적으로 분석하지 않아도 자동으로 단어를 이해합니다. 말하자면, 음소를 매번 해독하지 않아도 뇌가 거의 즉시 의미를 구성해 내는 것입니다. 이런 과정은 상당 부분 무의식적으로 이루어집니다. 또 어떤 장비의 설정이 바뀌었다고 믿고 실제로 차이를 들었다고 느꼈는데, 나중에 보니 장비가 연결되어 있지 않았다는 경우도 있습니다. 맥거크 효과(McGurk effect) 역시 대표적인 예입니다. 입 모양이라는 시각 정보가 같은 소리를 전혀 다르게 들리게 만들 수 있습니다.
이처럼 우리의 뇌는 의식에 도달하기 전 단계에서 이미 다양한 방식으로 소리를 해석하고 수정합니다. 그리고 의식적인 수준에서는 그 소리의 의미를 생각하거나, 말투와 강조, 리듬 같은 요소를 인식합니다. 실제 대화에서는 단어의 의미를 의식적으로 이해하는 과정과, 억양·강세·문장 끝맺음 같은 단서를 반쯤 자동으로 읽어내는 과정이 동시에 일어납니다. 하지만 무의식과 의식의 경계는 완전히 분리된 것이 아니라 연속적인 스펙트럼에 가깝습니다.
또 하나 중요한 점은, 인간의 소리 기억이 소리를 그대로 복사해 저장하는 방식이 아니라는 것입니다. 우리는 종종 소리 자체보다 그 소리에 대해 느꼈던 인상과 감정을 기억합니다. 그래서 지금 듣는 소리와 과거의 소리를 비교하려 할 때에도, 실제 음향 그 자체보다는 그 소리에 대한 해석과 기억을 떠올리는 경우가 많습니다.
정리하면, 청각은 단순한 감각이 아니라 매우 복합적인 과정입니다. 귀의 물리적 구조, 뇌의 무의식적 처리, 의식적 해석이 함께 작동하며, 이 모든 요소가 우리가 듣는 방식에 영향을 줍니다.
음향, 아날로그, 디지털 영역
소리, 혹은 소리의 표현은 세 가지 영역에서 존재할 수 있습니다. 바로 음향 영역, 아날로그 영역, 디지털 영역입니다. 디지털 오디오는 실제로 이 세 영역을 모두 포함하므로, 세 가지를 모두 이해하는 것이 중요합니다.
우리가 이미 살펴본 것처럼, 소리는 공기 같은 매질 속의 진동하는 파동으로 시작합니다. 이것이 음향 영역입니다. 전자적으로 생성된 경우를 제외하면 모든 소리는 결국 이 음향 영역에서 출발하며, 사람이 들을 수 있으려면 다시 이 영역으로 돌아와야 합니다. 음향 영역의 장점은 전자 기술이 전혀 필요 없다는 것이지만, 단점은 녹음이 불가능하다는 점입니다. 한 번 울린 소리는 사라지면 끝입니다.
예를 들어 빈 병에 대고 말을 한 뒤 다시 열었을 때 그 안에서 내 목소리가 재생되지는 않습니다. 음향 영역 안에서 소리를 만드는 수단은 어쿠스틱 악기와 같은 물리적 도구이며, 그 소리는 악기의 물리적 성질에 의해 결정됩니다. 예를 들어 튜바로는 가볍고 섬세한 고음을 내기 어렵고, 플루트로는 거대한 저음을 만들기 어렵습니다. 즉, 음향 영역에서는 소리의 가능성이 악기의 크기와 재질, 공명 구조 같은 물리적 조건에 크게 묶여 있습니다.


소리를 음향 영역에서 아날로그 영역으로 옮기려면, 마이크와 같은 장치를 통해 음파를 전류로 변환해야 합니다. 이 전류는 원래 음파의 앞뒤 움직임을 따라가며 같은 패턴을 그립니다. 다시 말해 원래 소리의 움직임을 전기 신호로 닮게 만든 것이기 때문에 이를 아날로그 영역이라고 부릅니다.
아날로그 영역은 음향 영역에 비해 여러 장점을 가집니다. 가장 큰 장점은 기록과 편집이 가능하다는 점입니다. 예를 들어 바이닐 레코드 같은 물리적 매체나 테이프 같은 자기 매체를 통해 소리를 저장하고 다룰 수 있습니다. 또한 증폭, 편집, 이펙트 처리 같은 다양한 조작이 가능하며, 전자적으로 생성된 소리도 만들 수 있습니다. 특히 음향 영역에서는 높은 소리를 내려면 작은 악기가, 낮은 소리를 내려면 큰 악기가 필요한 경향이 있지만, 아날로그 영역에서는 이런 물리적 크기의 제약 없이 원하는 음역의 전자음을 만들어낼 수 있습니다. 아날로그 영역에서는 원래 음향 영역에는 없던 왜곡이 생길 수 있는데, 이것은 의도치 않으면 좋지 않게 들릴 수 있고, 의도적으로 사용하면 매력적인 소리로 작용할 수도 있습니다.


예를 들어 마이크가 과부하되어 말소리가 알아듣기 어려울 정도로 찌그러지는 경우는 좋지 않은 왜곡이고, 반대로 일렉트릭 기타 솔로의 드라이브 사운드는 의도된 왜곡으로 좋은 예가 될 수 있습니다. 아날로그 녹음에서는 시간 조작도 가능하지만, 테이프를 물리적으로 자르거나 뒤집는 등의 방식처럼 물리적 제약이 큽니다. 면도날로 테이프를 잘라 편집하거나, 테이프를 뒤집어 거꾸로 재생하는 식의 작업이 대표적입니다. 또한 속도를 빠르게 하거나 늦출 수는 있어도, 음높이·속도·톤이 서로 묶여 있기 때문에 하나만 독립적으로 바꾸기는 어렵습니다.
🎛️ 실습도구 25
버추얼 아날로그 신시사이저
배음이 풍부한 톱니파를 필터와 엔벌로프로 다듬어, 버추얼 아날로그 신시사이저를 직접 연주해 보세요.
기본 음역대로 연주됩니다.
디지털 영역은 여기서 한 걸음 더 나아갑니다. 소리를 디지털 영역으로 옮기려면, 먼저 아날로그 신호를 소리의 파형을 나타내는 숫자열로 바꿔야 합니다. 이 과정을 샘플링(sampling)이라고 하며, 아날로그 신호를 1초에 수천 번씩 측정해 그 값을 숫자로 기록합니다. 이렇게 저장된 숫자들을 소프트웨어가 처리하면, 결국 그 숫자가 가리키는 소리 자체를 조작하는 것과 같은 효과가 납니다.
디지털 영역에서는 음향이나 아날로그 영역에서는 불가능했던 방식으로 소리를 변형할 수 있습니다. 디지털 왜곡 또한 아날로그 왜곡처럼 의도적이거나 비의도적일 수 있습니다. 또한 디지털 녹음에서는 음높이, 속도, 톤을 서로 독립적으로 조정할 수 있고, 아날로그 영역에서는 불가능한 다양한 방식으로 소리를 합성하고 편집할 수 있습니다. 다만 중요한 점은, 우리가 실제로 듣는 소리는 언제나 다시 스피커나 헤드폰을 거쳐 공기 중의 파동으로 돌아와야 한다는 것입니다. 즉 디지털 오디오는 따로 떨어진 세계가 아니라, 결국 음향 영역과 아날로그 영역 위에 세워진 확장된 작업 영역이라고 볼 수 있습니다.
🎚️ 실습도구 26
피치와 속도 조절: 아날로그 vs 디지털
아날로그 모드: 테이프 속도를 바꾸는 것처럼 피치와 속도가 항상 함께 변합니다.
오디오를 불러오는 중...
오늘날 디지털 오디오가 녹음의 표준이 된 가장 큰 이유는 이런 유연성 때문입니다. 소프트웨어는 계속 발전하고 있고, 이제는 초보자도 예전보다 훨씬 쉽게 이 도구를 다룰 수 있습니다. 그래서 디지털 영역을 전혀 거치지 않은 녹음물을 듣는 일은 이제 매우 드뭅니다. 결국 디지털 오디오를 제대로 이해한다는 것은 숫자를 다루는 법만 익히는 것이 아니라, 그 숫자가 다시 공기 중의 진동이 되고 청자의 지각으로 이어진다는 사실까지 함께 이해하는 일입니다. 그래야 디지털 오디오의 장점을 제대로 활용하고, 한계나 부작용도 더 잘 다룰 수 있습니다.