기록공간

프로세스, 메모리 영역 본문

Computer Architecture

프로세스, 메모리 영역

입코딩 2020. 7. 26. 19:16
반응형

이번에는 프로그램이 메모리에 적재되어 프로세스의 상태로 실행될 때, 메모리 공간에서 발생하는 일들에 대해 정리해보도록 하겠다.

 

RAM에 할당된 프로세스 공간

프로세스는 RAM에 일부 공간을 할당받아 생성된다. 그렇게 할당받는 공간은 크게 4가지 영역으로 구성된다.

 

1. 코드(Code) 영역 : 실행 파일을 구성하는 명령어들이 올라가는 영역

  • 코드가 들어가는 부분이므로 쓰기가 금지된 영역
  • 수정될 것이 없으므로 고정(Static)된 크기를 가진다.

2. 데이터(Data) 영역 : 전역 변수들을 저장하는 영역

  • 사실 데이터 영역은 초기화된 값이 저장되는 데이터 영역과 초기화되지 않은 값이 저장되는 bss 영역이 구분된다.
  • 그렇게 해서 크게 5가지로 나누는 경우도 있다.

3. 힙(Heap) 영역 : 동적(Dynamic) 메모리(malloc, new 등) 할당에 사용되는 영역

  • 사용자가 직접 접근할 수 있는 영역
  • 크기가 고정되어 있지 않고, 필요에 따라 영역의 크기가 커지거나 작아진다.
  • 메모리 할당 (allocate)과 해제 (deallocate)에 의해 관리된다.

4. 스택(Stack) 영역 : 지역 변수 및 함수의 파라미터를 저장하는 영역

  • 함수 호출 과정에 따라 리턴주소(함수가 끝나면 함수 호출 전으로 돌아가기 위한 주소)가 들어갔다 나왔다 하므로 크기가 가변적이다.
  • 다른 영역과 반대로 주소값이 높은 곳에서부터 값이 들어간다.
  • 값이 스택에 들어가는 것을 push, 나오는 것을 pop이라고 한다.
  • 높은 주소에서부터 값이 쌓이면, 맨 위의 값부터 나올 수 있는 LIFO(Last In First Out)의 형태이다.

 

 

프로그램이 실행될 때 메모리 공간의 변화

C언어로 쓰인 짧은 코드를 예시로, 프로그램이 실행될 때 메모리 영역에 어떤 일들이 일어나는지를 정리해보겠다.

 

먼저, 수행되어야 하는 동작이 담긴 명령어(코드)들은 모드 코드 영역에 들어간다. 물론 아래 그림과 같은 C언어(고급 언어)의 형태가 아닌, 컴파일러를 거쳐 컴퓨터가 알 수 있도록 번역된 기계어의 형태일 것이다. 여기서는 어셈블리어를 따로 설명하지 않으므로 C언어로 표시하여 설명한다.

 

EIP(Extended Instruction Pointer, 확장된 명령 지시자) 레지스터는 코드 영역에서 실행되어야 할 부분을 가리킬 것이고, EIP 레지스터가 가리키는 순서대로 프로그램이 실행될 것이다. 위의 예시에서는 전역변수인 a가 데이터 영역에 들어갈 것이다. 그리고 main 함수가 실행된다. 

 

위 그림을 보면 main 함수가 실행되면서, old ebp가 스택에 쌓이는 것 (push)을 볼 수 있다. 이는 함수가 실행될 때마다 일어나는 일로, 이전에 실행중이던 상태로 돌아가기 위해 레지스터 값을 저장하는 것이다. 이미지에서는 ebp라고만 적혀있지만, 당시 사용 중이던 레지스터가 존재한다면 그 값들도 함께 저장된다. 이것 또한 함수의 실행이 종료되면, 저장해둔 값을 꺼내서 원래의 상태로 돌아가기 위함이다.

 

위의 이미지처럼 하나의 함수가 실행되면서, 그에 관련된 값이 스택에 쌓이는 부분을 하나의 스택 프레임(stack frame) 이라고 한다. 그러므로 old ebp는 스택 프레임 포인터 (Stack Frame Pointer, SFP)라고도 불린다. 

 

다음은 func 함수를 호출하는 부분이다. 호출할 함수에 전달할 인자가 역순으로 스택에 쌓이며, func 함수 실행이 완료되었을 때 돌아올 위치가 쌓인다. 이 돌아올 위치를 REturn Address(RET)라고 한다.

 

함수 호출에 필요한 값이 다 쌓이고 나면, 함수가 실행된다. 위 그림에서 func 함수가 실행될 때 쌓이는 값을 보여준다. func 함수는 func 함수의 스택 프레임을 가지기에, 기존에 main 함수의 ebp가 저장되고 ebp가 가리키는 위치가 변경된다.

 

마지막으로 연산을 수행한 후 func 함수가 종료되면, main으로 돌아오기 위해 쌓아 둔 값을 모두 빼내서 (pop) 레지스터 값을 복구시킨다. 그 결과로 아래의 이미지와 같이 func 함수 호출 전과 같은 형태로 스택이 돌아온 것을 확인할 수 있다.

 

 

메모리에 대한 이야기


컴퓨터를 구성하는 메모리는 CPU 내부에 존재하는 레지스터, 주 메모리인 RAM, 비휘발성으로 저장해야하는 데이터를 담고 있는 디스크가 있다. 이들은 모두 서로 다른 처리 속도용량을 가지고 있다.

 

일반적으로, CPU에 가까이 위치하는 메모리일수록 속도가 빠르고 용량이 적으며 가격이 비싸진다. 그렇기 때문에 RAM 처리 속도가 CPU에 미치지 못해 명령 수행에 지연이 발생한다. 그래서 그 둘 간의 속도 차이 완화를 위한 캐시가 CPU에 부착되고, 아래의 그림과 같은 메모리 계층 구조가 구성된다.

 

이전 글에서 주로 다뤘던 명령의 실행과정을 보면, 레지스터와 RAM 사이에는 수많은 데이터의 이동이 발생한다. 이런 데이터의 이동은 CPU가 명령의 처리를 위해 필요한 데이터를 요청하는 경우에 발생하곤 한다. 이런 데이터 처리를 다룰 때 사용하는 용어가 있는데, 적중(hit)실패(miss)이다.

 

  • 적중 (hit) : 프로세서가 요구한 데이터가 상위 계층(CPU에 가까운 메모리 계층)에 존재할 경우
  • 실패 (miss) : 프로세서가 요구한 데이터를 상위 계층에서 찾을 수 없을 경우 

CPU가 요청한 데이터가 레지스터라는 최상위 계층에 존재한다면, 데이터를 요청해서 받아오는 과정은 빠르게 처리될 것이다. 하지만 존재하지 않는다면, 하위 계층의 메모리로 접근하여 필요한 데이터를 찾아 나서야 할 것이다.

 

  • 적중률 (hit rate / hit ratio) : 메모리 계층의 성능을 평가하는 척도, 데이터를 찾기 위해 특정 메모리에 접근했을 때 해당 계층에서 찾을 수 있는 것의 비율
  • 실패율 (miss rate, 1.0 - (적중률 / 100)) : 데이터를 찾기 위해 특정 메모리에 접근 했을 경우, 해당 계층에서 찾을 수 없는 것의 비율
  • 적중 시간 (hit time) : 특정 메모리 계층에 접근하여 적중 / 실패 여부를 결정하는데까지 필요한 시간
  • 실패 손실 (miss penalty) : 하위 계층에서 필요한 데이터를 가져와서, 상위 계층에 전달되는 시간 + 데이터가 CPU에 전달되기까지의 시간

위 용어의 정의를 보면 알 수 있듯, CPU에 가까운 메모리일수록 적중 시간과 실패 손실이 적다.

 

빠른 시간 내에 명령을 처리하기 위해서는, CPU가 필요로 하는 데이터가 빠르게 전달되는 것이 좋다. 즉 필요로 할 것 같은 데이터들이 상위 계층에 있을수록 빠른 처리가 이루어질 것이다. 그렇다면 어떻게 필요로 할 것 같은 데이터들을 뽑아낼 수 있을까?

 

이는 지역성의 원리와 밀접한 관련이 있다.

  • 지역성의 원리 (principle of locality) : 프로그램은 비교적 최근에 접근한, 비교적 이전과 가까운 주소 공간의 메모리에 접근할 가능성이 높다.
  • 시간적 지역성 (temporal locality) : 어떤 항목이 참조되면, 그 데이터는 빠른 시간 내에 다시 참조될 가능성이 높다.
  • 공간적 지역성 (spatial locality) : 어떤 항목이 참조되면, 그 데이터 근처에 위치한 데이터들이 참조될 가능성이 높다.

많은 프로그램은 반복문 구조를 가지고 있고, 이는 명령과 데이터에 반복적으로 접근하기에 상당한 시간적 지역성을 보인다. 또한, 명령들은 순차적으로 접근되는 경우가 많기 때문에 공간적 지역성을 보이기도 한다. 그리고 메모리 계층구조는 이러한 특성들을 활용해 필요한 데이터들을 상위 계층에 적재한다.


본 내용의 출처는 https://cocojelly.github.io/computer/%EB%82%B4-%EB%A7%88%EC%9D%8C%EB%8C%80%EB%A1%9C-%EC%BB%B4%ED%93%A8%ED%84%B0-%EA%B5%AC%EC%A1%B0-%EC%A0%95%EB%A6%AC%ED%95%98%EA%B8%B0-(3)/입니다.

 

반응형
Comments