2주차. 소리의 개념

소리가 만들어지고 전달되고 지각되는 원리와, 음향·아날로그·디지털 도메인의 기초 개념을 학습합니다.

학습 목표

주파수·진폭·위상·음색의 개념을 설명한다
청각의 물리적 과정과 무의식적·의식적 처리의 차이를 이해한다
음향·아날로그·디지털 도메인의 차이와 연결 관계를 설명한다

소리는 무엇으로 이루어져 있는가?

오늘날 우리는 컴퓨터가 디지털 오디오를 재생하고 녹음하는 일을 너무도 자연스럽게 여깁니다. 디지털 오디오는 컴퓨터가 소리를 다루는 방식이지만, 그 뒤에는 생각보다 많은 원리가 숨어 있습니다. 디지털 오디오를 깊이 이해할수록 기술에 끌려다니기보다, 기술을 더 정확하고 유연하게 활용할 수 있게 됩니다.

디지털 오디오를 제대로 이해하려면, 먼저 소리가 어떻게 만들어지는지부터 출발해야 합니다. 우리 주변에는 공기 분자들이 가득하고, 소리는 그 공기 분포가 흔들릴 때 생깁니다. 예를 들어 손뼉을 치면, 손이 맞닿는 순간 주변 공기 분자에 갑작스러운 압력 변화가 생기고, 그 변화가 음파가 되어 퍼져 나갑니다.

👏 실습도구 01

공기 분자 진동 시뮬레이션

박수를 치면 공기 분자가 진동하며 음파가 퍼져나가는 과정을 관찰하세요. 캔버스를 클릭하면 해당 위치에서 음파가 발생합니다.

캔버스를 클릭하면 해당 위치에서 음파가 발생합니다.

여기서 중요한 점은, 분자 자체가 파동을 따라 이동하는 것은 아니라는 것입니다. 파동은 공기 속 분자들이 서로 충돌하며 만들어내는 움직임의 패턴으로 이루어집니다. 또 소리는 공기뿐 아니라 고체, 액체, 기체 등 어떤 매질에서도 전달될 수 있습니다. 예를 들어 고래의 울음소리는 바닷물 속을 통과해 전달되고, 기차 선로 같은 고체를 따라서도 소리가 전달될 수 있습니다. 이러한 고체, 액체, 기체는 모두 음향 도메인(acoustic domain)에 속하며, 이 도메인 안에서 음향 에너지 파동, 즉 소리가 이동합니다.

손뼉 소리는 짧고 단발적인 소리입니다. 하지만 기타 줄처럼 지속적인 소리를 생각해 보면 조금 다른 모습이 보입니다. 줄의 물리적 성질 때문에 줄은 일정한 비율로 앞뒤로 진동하고, 그 결과 공기 분자에도 규칙적인 압력 변화가 생깁니다. 우리는 이런 규칙적인 진동을 지속적인 소리, 더 나아가 하나의 음정으로 인식합니다.

🎸 실습도구 02

지속되는 소리 시뮬레이션

기타 줄을 튕기면 공기 분자들이 규칙적으로 진동하며 지속적인 음파가 퍼져나가는 과정을 관찰하세요.

기타 줄을 튕겨 지속되는 진동이 어떻게 전달되는지 관찰하세요.

다시 말해, 각각의 공기 분자가 파동과 함께 이동하는 것이 아니라, 분자들이 서로 충돌하는 패턴이 유지되면서 파동이 전파되는 것입니다. 이것은 경기장에서 사람들이 자리에서 조금씩 일어나고 앉으며 만드는 ‘웨이브’와 비슷합니다. 개개인은 제자리에서 조금씩만 움직이지만, 전체적인 파동은 훨씬 더 크고 경기장 전체를 돌아갑니다.

🏟 실습도구 03

스타디움 파도타기 시뮬레이션

사람들은 자기 자리에서 일어났다 앉을 뿐인데, 파도 모양은 경기장 전체를 이동합니다. 소리도 이와 같은 원리로 전달됩니다.

파도타기를 재생하면 사람들이 제자리에서만 움직이지만 파형은 옆으로 전달됩니다.

귀와 마이크는 바로 가까운 곳의 작은 공기 분자 집단이 어떻게 움직이는지를 감지하여 소리를 받아들입니다. 이 움직임의 패턴을 추적하고 다시 만들어내는 것이 모든 음향 녹음의 기초입니다. 따라서 소리를 디지털로 녹음하고 재생하려면, 이 패턴을 숫자로 어떻게 측정하고 기술할 수 있는지를 이해해야 합니다.

주파수와 진폭

숫자로 측정할 수 있는 소리의 가장 중요한 요소 두 가지는 주파수(frequency)와 진폭(amplitude)입니다. 먼저 주파수부터 살펴보겠습니다.

가장 단순한 형태의 소리인 사인파(sine wave)는 한 번에 하나의 주파수만 가집니다. 우리는 이 주파수를 낮은 음에서 높은 음까지 이어지는 스펙트럼 속의 음높이(pitch)로 지각합니다. 주파수와 피치라는 말을 서로 바꾸어 쓰는 경우도 있지만, 보통 피치는 음악적인 맥락에서 쓰이고, 주파수는 파동이 초당 몇 번 반복되는지를 뜻하는 보다 직접적인 물리량입니다.

이것은 음속과는 다릅니다. 바닷가에서 파도가 해변에 밀려오는 모습을 생각해 보면, 파도가 얼마나 빨리 이동하는지를 측정할 수도 있고, 파도가 얼마나 자주 도착하는지를 측정할 수도 있습니다. 예를 들어 파도가 1초마다 한 번씩 해변에 도달한다면, 주파수는 초당 1회입니다. 소리도 이와 마찬가지로, 특정 지점에서 공기 압력이 얼마나 자주 높아지고 낮아지는지를 초당 반복 횟수로 측정합니다. 이 단위를 헤르츠(hertz, Hz)라고 합니다.

🌊 실습도구 04

해변 파도와 주파수

파도가 해안에 얼마나 자주 도착하는지가 주파수입니다. 속도를 바꿔도 주파수(도착 빈도)는 변하지 않는 것을 확인해 보세요.

파도 주파수

1.0 Hz

파도 속도

1.0×

시간에 따라 특정 지점의 공기압이 어떻게 변하는지를 그래프로 그리면 소리의 형태를 어느 정도 시각적으로 이해할 수 있습니다. 주파수가 높은 소리는 공기압의 변화가 더 자주 일어나고, 주파수가 낮은 소리는 공기압의 변화가 더 천천히 일어납니다.

📊 실습도구 05

주파수와 압력 변동

주파수 슬라이더를 움직여 관측 지점에서의 압력 변동을 확인하세요.

주파수

1.0 Hz

이제 실제로 몇 가지 주파수의 소리를 들어보겠습니다. 아래 오실로스코프에서 각 버튼을 눌러 100Hz, 1kHz, 5kHz 사인파의 소리와 파형을 비교해 보세요. 주파수가 높아질수록 파형이 더 빽빽해지는 것을 확인할 수 있습니다.

🔊 실습도구 06

주파수별 파형 비교

주파수를 선택하고 재생 버튼을 눌러 소리와 파형을 확인하세요.

볼륨

모든 음악적 음에는 기본 주파수(fundamental frequency)가 있습니다. 악기와 목소리는 각기 낼 수 있는 음역대가 다르기 때문에, 높은 소리를 내는 악기는 더 높은 기본 주파수를 가지게 됩니다.

🎹 실습도구 07

악기 기본 주파수 대역

각 악기가 대체로 어떤 기본 음역을 가지는지 비교해 보세요. 같은 음정 계열이라도 악기에 따라 낼 수 있는 범위가 다릅니다.

현악기

금관악기

목관악기

건반악기

타악기

기타

100

200

500

10k

20k

Violin

Viola

Cello

Double Bass

Trumpet

Trombone

Horn

Tuba

Piccolo

Flute

Oboe

Clarinet

Alto Sax

Tenor Sax

Bassoon

Harp

Harpsichord

Piano

Xylophone

Glockenspiel

Vibraphone

Timpani

Marimba

Guitar

Bass Guitar

Voice

막대에 마우스를 올리면 각 악기의 기본음역이 표시됩니다.

앞서 예로 든 사인파는 단 하나의 주파수만으로 이루어진 소리였지만, 실제 악기에서 나는 복합적인 소리는 음높이를 결정하는 기본 주파수 외에도 여러 배음(harmonic frequencies)을 포함합니다. 이 추가적인 주파수 성분들이 소리의 음색(timbre)을 결정하며, 같은 음정을 내더라도 서로 다른 악기나 목소리가 다르게 들리는 이유가 됩니다.

여기서 기억해야 할 것은, 파동의 주파수가 얼마이든지 간에 소리 자체는 같은 속도로 움직인다는 점입니다. 즉, 소리는 음속으로 이동합니다. 다만 음속은 어떤 매질을 통과하느냐에 따라 달라집니다. 평균적인 온도와 습도의 공기 중에서는 초속 약 340미터 정도이며, 물속에서는 이보다 4배 이상 빠르고, 철 같은 고체에서는 15배 이상 빠르게 이동합니다.

💨 실습도구 08

매질별 음속 비교

주파수가 달라도 같은 매질 안에서는 같은 속도로 전달됩니다. 매질을 바꿔보세요.

음속: 340 m/s (공기)

저주파 (3 사이클)

고주파 (12 사이클)

반면 진폭(amplitude)은 파동이 얼마나 자주 움직이는지가 아니라, 얼마나 크게 움직이는가를 나타냅니다. 진폭이 작으면 조용한 소리이고, 진폭이 크면 큰 소리입니다. 다시 말해, 큰 소리는 더 높은 진폭을 가진 파동이고, 작은 소리는 더 낮은 진폭을 가진 파동입니다.

📢 실습도구 09

진폭별 파형 비교

진폭(Amplitude)은 파형의 크기를 나타냅니다. 진폭이 클수록 큰 소리가 납니다.

진폭은 공기압의 변화량이라고 생각해도 좋습니다. 기압계(barometer)는 특정 공간에서 공기 분자들이 평균적으로 얼마나 밀집해 있는지를 측정하며, 일반적으로 파스칼(pascal) 단위를 사용합니다.

기압계 — 공기 압력의 변동을 측정하듯, 소리의 크기도 압력의 변동으로 측정한다

소리에서 중요한 것은 절대적인 기압값이 아니라, 그 값이 얼마나 변하느냐입니다. 예를 들어 귀 근처의 공기압이 평균값에서 거의 변하지 않으면 우리는 침묵을 듣습니다. 반대로 약 1/25,000파스칼 정도의 아주 미세한 변화만 있어도 겨우 들을 수 있는 작은 소리가 생기고, 200파스칼 정도까지 흔들리면 제트엔진 가까이에서처럼 매우 크고 고통스러운 소리가 됩니다. 이렇게 보면 우리가 듣는 가장 작은 소리와 가장 큰 소리 사이에는 대략 500만 배에 이르는 차이가 있습니다.

상황	압력 변동
제트 엔진 (약 23m 거리)	200 Pa
대형 콘서트	20 Pa
전기톱	3.6 Pa
번화한 거리	0.2 Pa
속삭임	0.0063 Pa
조용한 대화	0.002 Pa
조용한 녹음실	0.00035 Pa
청력 역치 (겨우 들리는 소리)	0.00002 Pa

이처럼 우리가 들을 수 있는 진폭의 범위는 엄청나게 넓기 때문에, 이를 다루기 쉬운 형태로 표현하기 위해 로그 스케일(logarithmic scale)을 사용합니다. 이 스케일에서는 공기압 변화가 배수로 커질 때마다 수치가 단순히 덧셈 형태로 증가합니다. 이때 사용하는 단위가 데시벨(decibel, dB)입니다.

소리	압력 변동	음량 (dB SPL)
제트 엔진 (약 23m 거리)	200 Pa	140 dB SPL
대형 콘서트	20 Pa	120 dB SPL
전기톱	3.6 Pa	105 dB SPL
번화한 거리	0.2 Pa	80 dB SPL
속삭임	0.0063 Pa	60 dB SPL
조용한 대화	0.002 Pa	40 dB SPL
조용한 녹음실	0.00035 Pa	25 dB SPL
청력 역치	0.00002 Pa	0 dB SPL

데시벨은 엄밀히 말하면 독립적인 측정 단위라기보다 두 값을 비교하는 로그 비율입니다. 하지만 기준점을 정해 두면 실질적인 측정 단위처럼 편리하게 사용할 수 있습니다. 음향 영역에서는 이 기준을 음압 레벨(Sound Pressure Level, SPL)이라고 표시합니다. 예를 들어 대부분의 사람이 겨우 들을 수 있는 최소 수준을 0dB SPL로 두면, 그보다 훨씬 큰 소리도 비교적 다루기 쉬운 숫자로 표현할 수 있습니다. 제트엔진에 가까운 수준의 매우 큰 소리가 대략 140dB SPL로 표현되는 것도 그 때문입니다.

이 방식의 장점은 다양한 소리를 더 직관적인 숫자로 표현할 수 있다는 점입니다. 조용한 대화는 대체로 40dB SPL, 세탁기는 60dB SPL 정도, 체인소는 105dB SPL 정도가 됩니다. 녹음과 믹싱에서는 일반적으로 신호를 6dB 올리면 진폭이 두 배가 되고, 6dB 줄이면 진폭이 절반이 됩니다. 다른 분야에서는 약간 다르게 계산되기도 하지만, 녹음과 믹싱에서는 이 규칙이 매우 유용합니다.

정리하면, 주파수와 진폭은 소리를 설명하는 가장 기본적인 두 요소입니다. 주파수는 파동이 얼마나 자주 반복되는지를 나타내며 헤르츠 단위로 측정하고, 진폭은 파동이 얼마나 강하게 움직이는지를 나타내며 데시벨을 통해 기준점에 대한 상대값으로 표현합니다.

📐 실습도구 10

주파수와 진폭 비교

주파수와 진폭이 파형에 어떤 영향을 미치는지 비교해 보세요.

낮은 주파수

높은 주파수

높은 진폭

낮은 진폭

음색

지금까지 살펴본 사인파는 가장 단순한 형태의 소리입니다. 하지만 피아노, 기타, 바이올린 같은 실제 악기 소리는 훨씬 더 복잡합니다. 같은 ‘라’ 음을 연주해도 피아노와 바이올린이 다르게 들리는 이유는 바로 음색(timbre) 때문입니다. 즉, 음색은 같은 음높이와 같은 크기를 가진 소리라도 서로 다른 성격으로 들리게 만드는 요소입니다.

세상의 소리는 음정의 명확성에 따라 크게 세 가지로 나누어 생각할 수 있습니다. 피아노나 바이올린, 플루트처럼 ‘도레미’로 비교적 분명하게 부를 수 있는 소리가 있고, 박수나 스네어 드럼, 바람 소리처럼 특정한 음높이를 잡기 어려운 소리가 있습니다. 또 종소리나 팀파니, 마림바처럼 음정이 전혀 없는 것은 아니지만 어딘가 복잡하고 퍼져 있는 듯 들리는 소리도 있습니다. 이 차이를 이해하려면 소리를 구성하는 내부 성분을 살펴봐야 합니다.

아무리 복잡한 소리라도 결국은 여러 개의 사인파 성분이 합쳐진 것으로 볼 수 있습니다. 이 각각의 성분을 부분음(partial)이라고 합니다. 부분음 가운데 가장 낮은 주파수를 가진 성분은 기음(fundamental)이며, 우리가 인식하는 기본적인 음높이를 결정합니다. 그리고 기음을 제외한 더 높은 성분들을 통틀어 상음(overtone)이라고 부릅니다.

상음은 다시 두 부류로 나눌 수 있습니다. 기음의 2배, 3배, 4배처럼 정수배 관계에 있는 성분은 배음(harmonics)이고, 정수배 관계에 있지 않은 성분은 비배음(inharmonics)입니다. 음정이 분명한 악기 소리는 대체로 배음 구조가 잘 정리되어 있습니다. 예를 들어 기음이 100Hz라면 200Hz, 300Hz, 400Hz처럼 정수배 성분이 함께 울리며, 우리 귀는 이 질서 있는 관계를 하나의 안정된 음높이로 묶어서 인식합니다. 같은 음높이라도 악기마다 각 배음의 세기가 다르기 때문에 음색이 달라집니다.

🎛 실습도구 11

기음과 배음으로 만드는 음색 합성기

기음 주파수와 각 배음의 진폭을 조절해 보세요. 같은 음높이라도 배음 구조가 바뀌면 파형, 스펙트럼, 스펙트로그램, 그리고 실제로 들리는 음색이 함께 달라집니다.

기음 주파수220 Hz

55 Hz3.52 kHz

100%

기음

72%

2배음

42%

3배음

22%

4배음

12%

5배음

6배음

7배음

8배음

9배음

10배음

현재 배음 주파수

기음 · 220 Hz · 진폭 100%
2배음 · 440 Hz · 진폭 72%
3배음 · 660 Hz · 진폭 42%
4배음 · 880 Hz · 진폭 22%
5배음 · 1.10 kHz · 진폭 12%
6배음 · 1.32 kHz · 진폭 6%
7배음 · 1.54 kHz · 진폭 4%
8배음 · 1.76 kHz · 진폭 3%
9배음 · 1.98 kHz · 진폭 2%
10배음 · 2.20 kHz · 진폭 1%

배음은 항상 기음의 정수배로 계산됩니다. 기음을 올리면 모든 배음의 위치가 함께 이동하고, 각 배음의 진폭을 올리면 해당 주파수 성분이 더 강해집니다.

오실로스코프

스펙트럼 애널라이저

스펙트로그램

또 종소리나 팀파니처럼 음정이 어느 정도 느껴지지만 동시에 복잡한 울림이 큰 소리는 비배음 성분을 많이 포함하는 경우가 많습니다. 이 비배음들은 기음과 완전히 정렬되지 않기 때문에 소리에 독특하고 풍부한 울림을 더하면서도 음정을 조금 흐리게 만듭니다.

🔔 실습도구 12

비배음을 포함한 음정성 음색 비교

팀파니와 종소리처럼 기음은 느껴지지만 부분음의 일부가 정수배에서 벗어난 소리를 비교해 보세요. 프리셋을 바꾸면 부분음의 비율과 기본 진폭 배열이 함께 달라집니다.

기음은 들리지만 일부 부분음이 정수배에서 벗어나, 울림이 넓고 둥글게 퍼지는 타악기성 음색

기음 주파수220 Hz

55 Hz1.76 kHz

100%

기음

1.00×

42%

부분음 2

1.50×

30%

부분음 3

2.00×

32%

부분음 4

2.44×

18%

부분음 5

3.00×

10%

부분음 6

3.95×

부분음 비율과 주파수

기음 · 1.00× · 220 Hz · 진폭 100%
부분음 2 · 1.50× · 330 Hz · 진폭 42%
부분음 3 · 2.00× · 440 Hz · 진폭 30%
부분음 4 · 2.44× · 537 Hz · 진폭 32%
부분음 5 · 3.00× · 660 Hz · 진폭 18%
부분음 6 · 3.95× · 869 Hz · 진폭 10%

정수배가 아닌 비율(예: 2.44×, 4.20×)은 비배음입니다. 이런 성분이 섞이면 음정은 느껴지면서도 울림과 질감이 더 복잡해집니다.

오실로스코프

스펙트럼 애널라이저

스펙트로그램

반대로 박수, 바람, 스네어 드럼 같은 소리는 특정 기음이 두드러지지 않고, 많은 주파수 성분이 불규칙하게 섞여 있습니다. 이런 소리는 뚜렷한 음높이보다 질감과 에너지감으로 인식되며, 흔히 노이즈(noise) 계열의 소리라고 설명할 수 있습니다.

🌬 실습도구 13

노이즈 계열 음색 비교

바람 소리, 박수 소리, 스네어 드럼 소리를 직접 들어보세요. 세 소리는 모두 넓은 주파수 대역의 노이즈 성분이 강하며, 뚜렷한 기음보다는 질감과 에너지감이 중심이 됩니다.

저역과 중역이 부드럽게 흔들리는 필터드 노이즈. 뚜렷한 기음 없이 넓게 퍼지는 질감이 중심입니다.

소리 성격

• 바람 소리: 지속형, 부드러운 광대역 노이즈
• 박수 소리: 매우 짧은 충격성 노이즈 버스트
• 스네어 드럼: 짧은 노이즈 + 약한 톤 성분의 결합

프리셋 버튼을 누르면 해당 소리가 바로 재생됩니다. 시각화는 실제 analyser 데이터를 사용해 반응합니다.

오실로스코프

스펙트럼 애널라이저

스펙트로그램

이처럼 음색은 소리에 어떤 주파수 성분이 들어 있는지, 그리고 그 성분들이 얼마나 강한지에 따라 달라집니다. 오실로스코프가 시간에 따른 진폭 변화를 보여주는 도구라면, 스펙트럼 애널라이저(spectrum analyzer)는 한 순간에 어떤 주파수들이 얼마나 포함되어 있는지를 보여주는 도구입니다. 또한 스펙트로그램(spectrogram)은 시간의 흐름에 따라 주파수 분포가 어떻게 변하는지를 함께 보여줍니다. 따라서 음색을 이해한다는 것은 단순히 ‘소리가 밝다, 어둡다’고 느끼는 데서 그치지 않고, 그 소리를 구성하는 주파수들의 구조를 읽는 일과도 연결됩니다.

위상과 시간

파동의 주파수가 높을수록 1초 동안 더 많은 주기를 반복하게 되며, 따라서 각 주기의 길이는 더 짧아집니다. 파장(wavelength)은 이 한 주기의 길이를 의미합니다. 가장 단순한 사인파 한 주기를 보면, 처음 상승하여 정점에 도달하고, 다시 하강해 바닥을 지나 출발점으로 돌아오는 과정이 하나의 주기입니다.

오실로스코프에서 보았듯이, 가로축은 시간을, 세로축은 공기압을 나타냅니다. 사인파는 시간이 흐르면서 양의 진폭과 음의 진폭 사이를 부드럽게 오가며 진동합니다. 이 진동은 원의 각도처럼 0도, 90도, 180도, 270도, 그리고 다시 360도(또는 0도)로 측정할 수 있습니다. 이 그래프는 시간에 따른 파형의 위상(phase)도 함께 보여 줍니다. 여기서 위상이란, 현재 파동이 한 주기 안에서 어느 위치에 있는지를 뜻합니다.

🌀 실습도구 14

위상과 시간의 관계 보기

원 위의 각도와 오실로스코프 파형상의 위치를 함께 보면서, 위상이 한 주기 안에서 어디를 가리키는지 확인해 보세요. 한 점이 원을 한 바퀴 도는 과정이 사인파 한 주기와 대응됩니다.

원 위의 위상

시간에 따른 사인파

현재 위상0°

자동 진행 속도0.25 회/초

0°에서는 진폭이 0에서 시작하고, 90°에서 최대, 180°에서 다시 0, 270°에서 최소가 됩니다. 즉 위상은 단순한 각도가 아니라, 시간 속에서 파동이 현재 어느 위치에 있는지를 보여 주는 좌표입니다.

하지만 더 흥미로운 것은 두 개 이상의 소리가 서로 어떤 상대적 위상 관계를 가지는가입니다. 두 개의 음파를 합치면 새로운 형태의 파동이 만들어집니다. 예를 들어 완전히 동일한 두 소리를 서로 섞는다고 해 봅시다. 이 둘이 어떻게 합쳐지는지는 서로의 타이밍, 즉 상대적 위상에 달려 있습니다.

만약 두 파형의 위아래 움직임이 정확히 맞아떨어지면 완전히 동위상(in phase) 상태가 되며, 결과적으로 소리는 두 배 더 크게 들립니다. 반대로 하나의 파형이 올라갈 때 다른 파형이 내려가도록 완전히 반대 방향으로 정렬되어 있으면, 두 소리는 서로 상쇄되어 완전한 침묵이 됩니다. 상대적 위상이 그 중간 어디쯤에 있으면, 일부는 강화되고 일부는 상쇄됩니다.

〰️ 실습도구 15

상대 위상에 따른 합성과 상쇄

같은 주파수의 두 사인파를 겹쳐 보면서, 상대 위상이 맞을 때는 얼마나 커지고 반대일 때는 얼마나 상쇄되는지 확인해 보세요.

상대 위상0°

0° 동위상90° 중간180° 완전 상쇄

현재 해석

완전 동위상: 두 파형이 같은 방향으로 움직여 가장 크게 합쳐집니다.

• 기준 주파수: 220 Hz
• 합성 peak: +2.00
• 상대 크기: 1.00

0°에서는 두 파형이 같은 방향으로 움직여 크게 들리고, 180°에서는 위아래가 완전히 반대가 되어 서로 지워집니다. 그 사이 값에서는 일부 구간은 강화되고 일부 구간은 상쇄됩니다.

주파수가 다른 파형들을 합칠 때는 더욱 흥미로운 일이 벌어집니다. 예를 들어 250Hz 사인파와 1600Hz 사인파를 합치면 둘의 특징을 동시에 가진 더 복잡한 파형이 됩니다.

🎛️ 실습도구 16

서로 다른 주파수의 파형 합성

250Hz와 1600Hz 사인파를 따로 보고, 함께 섞었을 때 합성 파형이 어떻게 더 복잡해지는지 확인해 보세요.

재생 모드

학습 포인트

• 낮은 주파수는 큰 윤곽을 만듭니다.
• 높은 주파수는 세부적인 잔물결을 더합니다.
• 두 파형이 합쳐지면 더 복잡한 파형이 됩니다.

이어지는 콤 필터링 설명은, 이런 복합 파형을 다시 지연된 복사본과 섞을 때 각 주파수 성분이 다르게 강화·상쇄된다는 이야기입니다.

그런 다음 이 복합 파형을 두 개 복사해 서로 타이밍을 약간 바꾸어 섞으면, 각 주파수 성분이 서로 다른 방식으로 강화되거나 상쇄됩니다. 이를 콤 필터링(comb filtering)이라고 하며, 복합적인 소리를 지연된 복사본과 섞을 때 어떤 주파수는 사라지고 어떤 주파수는 더 강조되는 현상을 말합니다.

🪮 실습도구 17

콤 필터링의 기본 원리

복합 파형을 지연된 복사본과 섞어 보면서, 어떤 주파수는 강화되고 어떤 주파수는 약해지는 콤 필터링의 원리를 확인해 보세요.

원 신호 · 지연 복사본 · 결과 파형

지연에 따른 강조/감쇠 주파수

지연 시간0.80 ms

0 ms2.5 ms5 ms

현재 해석

• 첫 감쇠 지점(notch): 625 Hz
• 첫 강화 지점(peak): 1.3 kHz
• 250 Hz 반응: 1.62
• 1600 Hz 반응: 1.27

지연 시간이 길어질수록 강조와 감쇠가 더 촘촘하게 배치됩니다. 그래서 같은 복합 신호라도 지연값이 바뀌면 톤이 달라집니다.

다양한 소리에 콤 필터링을 적용하여 그 효과를 직접 들어보고, 스펙트럼 애널라이저와 스펙트로그램에서 어떤 주파수가 상쇄되고 보강되는지 확인해 보세요.

🎚️ 실습도구 18

다양한 소리에 적용해 보는 콤 필터링

서로 다른 종류의 소리에 같은 콤 필터를 적용해 보세요. 소리의 종류가 달라도 특정 주파수는 약해지고, 다른 주파수는 도드라지는 변화를 스펙트럼과 스펙트로그램에서 확인할 수 있습니다.

가볍고 밝은 음악입니다. 콤 필터가 걸리면 중고역의 반짝임과 악기 분리가 어떻게 달라지는지 듣기 좋습니다.

지연 시간1.20 ms

0 ms4 ms8 ms

현재 해석

• 첫 감쇠 지점(notch): 417 Hz
• 첫 강화 지점(peak): 833 Hz
• 상태: 오디오를 선택하고 재생해 보세요.

오디오 파일은 `public/audio/mt3/common/`에 공용 자산으로 두었습니다. 나중에 다른 실습도구에서도 같은 파일을 그대로 재사용할 수 있습니다.

오실로스코프

스펙트럼 애널라이저

스펙트로그램

또 하나 중요한 점은, 같은 소리 두 개를 완전히 같은 타이밍에 두고 그중 하나를 뒤집으면 역시 완전한 상쇄가 일어난다는 것입니다. 많은 사람이 이것을 ‘위상이 뒤집혔다’라고 말하지만, 엄밀히 말하면 그것은 정확한 표현이 아닙니다. 위상은 시간 차이이고, 뒤집는 것은 시간 차이가 아니라 파형의 위아래를 바꾸는 일입니다.

🔀 실습도구 19

극성 반전과 완전 상쇄

같은 타이밍의 두 신호 중 하나를 위아래로 뒤집으면, 시간 차이 없이 서로 상쇄될 수 있습니다. 이것은 위상 이동이라기보다 극성 반전의 효과입니다.

비교 모드

현재 해석

완전히 같은 타이밍에서 한쪽 극성만 반전하므로 서로 상쇄됩니다.

• 기준 주파수: 220 Hz
• 합성 peak: 0.00
• 타이밍 차이: 0 ms

즉, 양이 음이 되고 음이 양이 되도록 뒤집는 것은 위상 반전이라기보다 극성 반전(inverting the polarity)이라고 부르는 것이 정확합니다. 특히 이것은 음악 전체처럼 복잡한 파형에서 매우 중요한 구분입니다. 같은 소리를 두 개 복사해 하나를 몇 밀리초 지연시켜 섞으면 전체 소리가 사라지는 것이 아니라 톤이 변하는 콤 필터링이 일어납니다. 그러나 두 소리의 타이밍을 완전히 일치시킨 다음, 그중 하나의 극성을 반전시키면 전체 소리가 완전히 상쇄되어 침묵이 됩니다. 이것이 위상과 극성의 차이입니다.

우리는 어떻게 소리를 듣는가?

우리가 소리를 어떻게 듣는가는 매우 복잡한 과정이며, 지금도 과학은 새로운 사실을 계속 발견하고 있습니다. 여기서는 이 과정을 물리적(physical), 무의식적(subconscious), 의식적(conscious) 세 부분으로 나누어 생각해 보겠습니다.

공기 중의 소리가 귀에 도달하면, 그 소리를 지각하는 첫 단계는 물리적인 과정입니다. 공기압의 변화, 즉 음향적 파동은 귓바퀴(pinnae)에 의해 일부 반사되고 모양이 바뀌며, 외이도를 통해 안쪽으로 전달됩니다. 고막은 이 압력 변화에 따라 진동하고, 그 진동은 이소골(ossicles)이라 불리는 아주 작은 뼈들의 연쇄 운동으로 이어집니다. 이 뼈들은 그 움직임을 기계적으로 증폭해 달팽이관(cochlea) 내부의 액체를 움직이게 합니다.

달팽이관 안에는 수천, 수만 개의 아주 작은 유모세포(hair cells)가 있으며, 각각은 자신의 크기와 강성에 따라 특정한 좁은 주파수 범위에 공명하도록 되어 있습니다. 이 작은 털들은 움직임을 감지하지만, 피부의 털처럼 ‘감각’으로 처리되지 않고 뇌에서 ‘소리’로 처리됩니다.

일반적으로 젊은 사람의 청각 범위는 약 20Hz에서 20,000Hz까지입니다. 하지만 나이가 들수록 고주파 청력이 약해지는 경향이 있습니다. 이는 높은 주파수에 공명하는 유모세포일수록 더 작고 섬세하기 때문입니다. 소리가 클수록 이 털들은 더 많이 흔들리고, 특히 큰 소리에 장기간 노출되면 점차 약해지거나 손상됩니다. 반면 저주파를 담당하는 유모세포는 상대적으로 덜 섬세하기 때문에, 저주파 청력은 비교적 잘 보존되는 편입니다.

🎹 실습도구 20

청각 범위와 악기 주파수 대역

맨 윗줄은 사람의 대략적인 청각 범위(20Hz~20kHz)입니다. 각 악기는 기본음역과 함께 overtone(배음)이 더 높은 주파수까지 확장될 수 있습니다.

현악기

금관악기

목관악기

건반악기

타악기

기타

사람의 청각 범위

overtone 영역

100

200

500

10k

20k

Hearing

Violin

Viola

Cello

Double Bass

Trumpet

Trombone

Horn

Tuba

Piccolo

Flute

Oboe

Clarinet

Alto Sax

Tenor Sax

Bassoon

Harp

Harpsichord

Piano

Xylophone

Glockenspiel

Vibraphone

Timpani

Marimba

Guitar

Bass Guitar

Voice

막대에 마우스를 올리면 기본음역과 overtone 확장 범위가 표시됩니다.

이렇게 귀가 물리적으로 소리를 감지한 뒤에는, 신경 자극이 뇌로 전달되어 처리됩니다. 이 정신적 처리 과정을 연구하는 분야를 정신음향학(psychoacoustics)이라고 합니다. 이 처리 중 일부는 우리의 의식 밖에서 이루어지고, 일부는 의식적인 수준에서 일어납니다.

예를 들어 제가 말하는 단어를 들을 때, 우리는 각각의 소리를 하나하나 의식적으로 분석하지 않아도 자동으로 단어를 이해합니다. 이런 과정은 상당 부분 무의식적으로 이루어집니다. 또 어떤 장비의 설정이 바뀌었다고 믿고 실제로 차이를 들었다고 느꼈는데, 나중에 보니 장비가 연결되어 있지 않았다는 경우도 있습니다. 맥거크 효과(McGurk effect) 역시 대표적인 예입니다. 입 모양이라는 시각 정보가 같은 소리를 전혀 다르게 들리게 만들 수 있습니다.

이처럼 우리의 뇌는 의식에 도달하기 전 단계에서 이미 다양한 방식으로 소리를 해석하고 수정합니다. 그리고 의식적인 수준에서는 그 소리의 의미를 생각하거나, 말투와 강조, 리듬 같은 요소를 인식합니다. 하지만 무의식과 의식의 경계는 완전히 분리된 것이 아니라 연속적인 스펙트럼에 가깝습니다.

또 하나 중요한 점은, 인간의 소리 기억이 소리를 그대로 복사해 저장하는 방식이 아니라는 것입니다. 우리는 종종 소리 자체보다 그 소리에 대해 느꼈던 인상과 감정을 기억합니다. 그래서 지금 듣는 소리와 과거의 소리를 비교하려 할 때에도, 실제 음향 그 자체보다는 그 소리에 대한 해석과 기억을 떠올리는 경우가 많습니다.

정리하면, 청각은 단순한 감각이 아니라 매우 복합적인 과정입니다. 귀의 물리적 구조, 뇌의 무의식적 처리, 의식적 해석이 함께 작동하며, 이 모든 요소가 우리가 듣는 방식에 영향을 줍니다.

음향, 아날로그, 디지털 도메인

소리, 혹은 소리의 표현은 세 가지 도메인에서 존재할 수 있습니다. 바로 음향 도메인(acoustic domain), 아날로그 도메인(analog domain), 디지털 도메인(digital domain)입니다. 디지털 오디오는 실제로 이 세 도메인을 모두 포함하므로, 세 가지를 모두 이해하는 것이 중요합니다.

우리가 이미 살펴본 것처럼, 소리는 공기 같은 매질 속의 진동하는 파동으로 시작합니다. 이것이 음향 도메인입니다. 전자적으로 생성된 경우를 제외하면 모든 소리는 결국 이 음향 도메인에서 출발하며, 사람이 들을 수 있으려면 다시 이 도메인으로 돌아와야 합니다. 음향 도메인의 장점은 전자 기술이 전혀 필요 없다는 것이지만, 단점은 녹음이 불가능하다는 점입니다. 한 번 울린 소리는 사라지면 끝입니다.

예를 들어 빈 병에 대고 말을 한 뒤 다시 열었을 때 그 안에서 내 목소리가 재생되지는 않습니다. 음향 도메인 안에서 소리를 만드는 수단은 어쿠스틱 악기와 같은 물리적 도구이며, 그 소리는 악기의 물리적 성질에 의해 결정됩니다. 예를 들어 튜바로는 가볍고 섬세한 고음을 내기 어렵고, 플루트로는 거대한 저음을 만들기 어렵습니다.

소리를 음향 도메인에서 아날로그 도메인으로 옮기려면, 마이크와 같은 장치를 통해 음파를 전류로 변환해야 합니다. 이 전류는 원래 음파의 앞뒤 움직임을 따라가며 같은 패턴을 그립니다. 다시 말해 원래 소리의 움직임을 전기 신호로 닮게 만든 것이기 때문에 이를 아날로그 도메인이라고 부릅니다.

아날로그 도메인은 음향 도메인에 비해 여러 장점을 가집니다. 가장 큰 장점은 기록과 편집이 가능하다는 점입니다. 예를 들어 바이닐 레코드 같은 물리적 매체나 테이프 같은 자기 매체를 통해 소리를 저장하고 다룰 수 있습니다. 또한 증폭, 편집, 이펙트 처리 같은 다양한 조작이 가능하며, 전자적으로 생성된 소리도 만들 수 있습니다. 특히 음향 도메인에서는 높은 소리를 내려면 작은 악기가, 낮은 소리를 내려면 큰 악기가 필요한 경향이 있지만, 아날로그 도메인에서는 이런 물리적 크기의 제약 없이 원하는 음역의 전자음을 만들어낼 수 있습니다. 아날로그 도메인에서는 원래 음향 도메인에는 없던 왜곡이 생길 수 있는데, 이것은 의도치 않으면 좋지 않게 들릴 수 있고, 의도적으로 사용하면 매력적인 소리로 작용할 수도 있습니다.

릴투릴 테이프 머신을 통해 자기 테이프에 소리를 기록하고 재생하는 아날로그 장비

바이닐 레코드 플레이어 위에서 회전하는 레코드를 보여주는 아날로그 물리 매체의 예시

예를 들어 마이크가 과부하되어 말소리가 알아듣기 어려울 정도로 찌그러지는 경우는 좋지 않은 왜곡이고, 반대로 일렉트릭 기타 솔로의 드라이브 사운드는 의도된 왜곡으로 좋은 예가 될 수 있습니다. 아날로그 녹음에서는 시간 조작도 가능하지만, 테이프를 물리적으로 자르거나 뒤집는 등의 방식처럼 물리적 제약이 큽니다. 또한 속도를 빠르게 하거나 늦출 수는 있어도, 음높이·속도·톤이 서로 묶여 있기 때문에 하나만 독립적으로 바꾸기는 어렵습니다.

🎛️ 실습도구 21

버추얼 아날로그 신시사이저

배음이 풍부한 톱니파를 필터와 엔벌로프로 다듬어, 버추얼 아날로그 신시사이저를 직접 연주해 보세요.

버추얼 키보드

필터 컷오프1.80 kHz

레조넌스4.0

Attack0.03 s

Release0.35 s

건반을 누르면 해당 음의 주파수로 신시사이저가 재생됩니다.

디지털 도메인은 여기서 한 걸음 더 나아갑니다. 소리를 디지털 도메인으로 옮기려면, 먼저 아날로그 신호를 소리의 파형을 나타내는 숫자열로 바꿔야 합니다. 이 과정을 샘플링(sampling)이라고 하며, 아날로그 신호를 1초에 수천 번씩 측정해 그 값을 숫자로 기록합니다. 이렇게 저장된 숫자들을 소프트웨어가 처리하면, 결국 그 숫자가 가리키는 소리 자체를 조작하는 것과 같은 효과가 납니다.

디지털 도메인에서는 음향이나 아날로그 도메인에서는 불가능했던 방식으로 소리를 변형할 수 있습니다. 디지털 왜곡 또한 아날로그 왜곡처럼 의도적이거나 비의도적일 수 있습니다. 또한 디지털 녹음에서는 음높이, 속도, 톤을 서로 독립적으로 조정할 수 있고, 아날로그 도메인에서는 불가능한 다양한 방식으로 소리를 합성하고 편집할 수 있습니다.

🎚️ 실습도구 22

피치와 속도 조절: 아날로그 vs 디지털

아날로그 모드: 테이프 속도를 바꾸는 것처럼 피치와 속도가 항상 함께 변합니다.

피치 (음높이)1.00×

0.5×1.0×2.0×

속도 (재생 시간)1.00×

0.5×1.0×2.0×

🔗 피치와 속도가 연결됨

오디오를 불러오는 중...

디지털 오디오가 오늘날 녹음의 표준이 된 이유는 바로 이 강력한 유연성 때문입니다. 소프트웨어는 계속 발전하면서 이러한 힘을 초보자에게도 더 쉽게 제공하고 있으며, 오늘날 디지털 도메인을 전혀 거치지 않은 녹음물을 듣는 일은 매우 드뭅니다. 디지털 오디오의 힘을 제대로 활용하고, 그 한계나 부작용까지도 잘 다루기 위해서는 이 원리를 깊이 이해하는 것이 중요합니다.