일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 스케줄링
- codility
- DirectX12
- OS
- 쓰레드
- 프로그래머스
- 멀티쓰레드
- 백준
- 병행성
- DirectX 12
- 그리디 알고리즘
- 병행성 관련 오류
- 알고리즘
- 파일시스템 구현
- I/O장치
- 디자인패턴
- 렌더링 파이프라인
- 동적계획법
- 다이나믹 프로그래밍
- 영속성
- 다이나믹프로그래밍
- Direct12
- 타입 객체
- 멀티프로세서
- 컨디션 변수
- directx
- 운영체제
- 락
- 자료구조
- 그리디알고리즘
- Today
- Total
기록공간
2-11장. 페이징 : 개요 본문
우리는 앞에서 공간 관리 문제를 해결하기 위해 세그멘테이션을 이용하여, 가변 크기의 조각들로 분할하는 방법을 사용한다는 것을 살펴봤다. 하지만 이것은 태생적인 문제를 가지고 있다. 공간을 다양한 크기의 청크로 분할할 때 공간 자체가 단편화(Fragmented) 될 수 있고, 할당은 점점 더 어려워진다.
이러한 문제점을 해결하기 위해서 공간을 동일한 크기의 조각으로 분할하는 것을 고려해 볼 필요가 있다. 가상 메모리에서 이를 페이징(Paging)이라 부른다. 프로세스의 주소 공간을 몇개의 가변 크기의 논리 세그멘트(힙, 스택, 코드)로 나누는 것이 아니라 고정 크기의 단위로 나눈다. 이 각각의 고정 크기 단위를 페이지(Page)라고 부른다. 물리 메모리도 페이지 프레임(Page frame)이라고 불리는 고정 크기의 슬롯의 배열이라고 생각한다. 이 프레임 각각은 하나의 가상 메모리 페이지를 저장할 수 있다. 페이지를 사용하여 어떻게 메모리를 가상화 할 수 있을까?
간단한 예제 및 개요
이 방법을 명확히 이해하기 위해 간단한 예를 통해 설명해 보자.
위 그림은 총 크기가 64바이트이면서 4개의 16바이트 페이지(0, 1, 2, 4)로 구성된 작은 주소 공간의 예를 보여준다.(물론 실제 주소 공간은 훨씬크다.)
물리 메모리는 위 그림과 같이, 고정 크기의 슬롯들로 구성된다. 이 경우 8개의 페이지 프레임, 총 128바이트의 비현실적으로 작은 물리 메모리이다. 그림에서 볼 수 있듯이, 가상 주소 공간의 페이지들은 물리 메모리 전체에 분산 배치되어 있다. 또한 운영체제가 자기자신을 위해서 물리 메모리의 일부를 사용하는 것도 보여준다.
앞으로 보겠지만, 페이징은 이전 방식에 비해 많은 장점을 가지고 있다. 아마도 가장 중요한 개선은 유연성일 것이다. 페이징을 사용하면 프로세스의 주소 공간 사용 방식과는 상관없이 효율적으로 주소 공간 개념을 지원할 수 있다. 예를 들어, 힙과 스택이 어느 방향으로 커지는가, 어떻게 사용되는가에 대한 가정을 하지 않아도 된다.
또 다른 장점은 페이징이 제공하는 빈 공간 관리의 단순함이다. 예를 들어, 운영체제가 64바이트 주소 공간을 8페이지 물리 메모리에 배치하기를 원한다고 할 때, 운영체제는 비어 있는 네 개의 페이지만 찾으면 된다. 아마 이를 위해 운영체제는 모든 비어 있는 페이지의 빈 공간 리스트를 유지하고 리스트의 첫 네 개 페이지를 선택할 것이다. 위 예에서 현재 페이지 프레임 1, 4, 6이 비어 있다.
주소 공간의 각 가상 페이지에 대한 물리 메모리 위치 기록을 위하여 운영체제는 프로세스 마다 페이지 테이블(Page table)이라는 자료 구조를 유지한다. 페이지 테이블의 주요 역할은 주소 공간의 가상 페이지 주소 변환(Address translation) 정보를 저장하는 것이다. 각 페이지가 저장된 물리 메모리의 위치가 어디인지 알려준다.
페이지 테이블은 프로세스마다 존재한다는 사실을 숙지해야 한다. 위의 예에서 다른 프로세스를 실행해야 한다면 운영체제는 이 프로세스를 위한 다른 페이지 테이블이 필요하다. 새 프로세스의 가상 페이지는 다른 물리 페이지에 존재하기 때문이다.
이제 주소 변환 준비가 되었다. 작은 주소 공간을 가진 프로세스가 다음 메모리 접근을 수행한다고 가정하자.
movl <virtual address>, %eax
구체적으로 주소 <virtual address>의 데이터를 eax 레지스터에 탑재하는 데에 집중하자.
프로세스가 생성한 가상 주소의 변환을 위해 먼저 가상 주소를 가상 페이지 번호(Virtual Page Number, VPN)와 페이지 내의 오프셋 2개의 구성 요소로 분할한다. 이 예에서는 가상 주소의 공간의 크기가 64바이트이기 때문에 가상 주소는 6비트가 필요하다.(2^6) 가상 주소를 개념적으로 다음 그림과 같이 생각할 수 있다.
이 그림에서 Va5는 가상 주소의 최상위 비트이며, Va0는 최하위 비트를 나타낸다. 우리는 페이지 크기를 알고 있기 때문에, 위 그림과 같이 가상 주소를 나눌 수 있다.
페이지 크기는 64바이트의 주소 공간에서 16바이트이다. 따라서 4페이지를 선택할 수 있어야 하고 따라서 주소의 최상위 2비트가 그 역할을 한다. 즉, 2비트 VPN을 가지게 된다. 나머지 비트는 페이지 내에서 우리가 원하는 바이트의 위치를 나타낸다. 이것을 오프셋이라고 부른다.
프로세스가 가상 주소를 생성하면 운영체제와 하드웨어가 의미있는 물리 주소로 변환한다. 예를 들어, 위 탑재 명령어의 가상 주소가 21이라고 하자.
movl 21, %eax
21을 이진 형식으로 변환하면 010101을 얻고, 이 가상 주소를 검사하고 가상 페이지 번호와 오프셋으로 나눈다.
따라서 가상 주소 21은 가상 페이지 1(01)의 5번째(0101) 바이트이다. 이 가상 페이지 번호를 가지고 페이지 테이블의 인덱스로 사용하여 가상 페이지 1이 어느 물리 프레임에 저장되어 있는지 찾을 수 있다. 위의 페이지 테이블에서 물리 프레임 번호(Physical Frame Number, PFN) 혹은 물리 페이지 번호(Physical Page Number, PPN)는 7(111)이다. VPN을 PFN으로 교체하여 가상 주소를 변환할 수 있다. 그런 후의 물리 메모리에 탑재 명령어를 실행한다.
오프셋은 동일하다는 것(변환되지 않는다)에 주의하라. 오프셋은 페이지 내에서의 우리가 원하는 위치를 알려 주기 때문이다. 최종적으로 계산된 물리 주소는 1110101이며, 이곳이 탑재할 데이터가 저장된 정확한 위치이다.
페이지 테이블은 어디에 저장되는가?
페이지 테이블은 매우 커질 수 있다. 우리가 이전에 논의했던 작은 세그멘트 테이블이나 베이스-바운드 쌍에 비해서 말이다. 예를 들어, 4KB 크기의 페이지를 가지는 전형적인 32비트 주소 공간을 상상해 보자. 이 가상 주소는 20비트 VPN과 12비트 오프셋으로 구성된다.
20비트 VPN은 운영체제가 각 프로세스를 위해 관리해야 하는 변환의 개수가 2^20이라는 것을 의미한다. 물리 주소로의 변환 정보와 다른 필요한 정보를 저장하기 위하여 페이지 테이블 항목(Page Table Entry, PTE)마다 4바이트가 필요하다고 가정하면, 각 페이지 테이블을 저장하기 위하여 4MB의 메모리가 필요하게 된다. 이것은 꽤 큰 크기이다. 프로세스 100개가 실행 중이라고 가정하자. 주소 변환을 위해서 운영체제가 400MB의 메모리를 필요로 하는 것을 의미한다. 컴퓨터가 GB 단위의 메모리를 가지고 있는 현재라도 변환을 위해 이런 큰 청크를 사용한다는 것은 매우 비정상적이다. 64비트 주소 공간을 위한 페이지 테이블의 크기가 얼마나 클지에 대해서는 생각하기조차 싫어진다.
페이지 테이블은 매우 크기 때문에 현재 실행 중인 프로세스의 페이지 테이블을 저장할 수 있는 회로를 MMU 안에 유지하지 않을 것이다. 대신 각 프로세스의 페이지 테이블을 메모리에 저장한다. 당분간 페이지 테이블은 운영체제가 관리하는 물리 메모리에 상주한다고 가정하자. 페이지 테이블은 운영체제 가상 메모리에 저장할 수 있고 심지어 디스크에 스왑될 수 있다. 그러나 현재로선 매우 혼란스럽기 떄문에 일단 무시한다.
위 그림을 살펴보면 운영체제 메모리 영역(PFN 0)에 페이지 테이블이 존재한다.
페이지 테이블에는 실제 무엇이 있는가?
페이지 테이블의 구조에 대해 살펴보자. 페이지 테이블은 가상 주소(VPN)를 물리 주소(PFN)로 매핑하는 데 사용되는 자료구조이다. 임의의 자료 구조도 사용 가능하다. 가장 간단한 형태는 선형 페이지 테이블(Linear page table)이다. 즉, 단순한 배열이다. 운영체제는 원하는 PFN을 찾기 위해서 VPN으로 배열의 항목에 접근하고 그 항목의 페이지 테이블 항목(PTE)을 검색한다. 지금은 이 간단한 선형 구조를 사용한다고 가정한다. 이후의 장에서 페이징과 관련된 문제를 해결하기 위해 고급 자료 구조를 사용할 것이다.
각 PTE에는 심도있는 이해가 필요한 비트들이 존재한다. Valid bit는 특정 변환의 유효 여부를 나타내기 위하여 포함된다. 예를 들어, 프로그램이 실행을 시작할 때 코드와 힙이 주소 공간의 한쪽에 있고 반대쪽은 스택이 차지하고 있을 것이다. 그 사이의 모든 미사용 공간은 무효(Invalid)로 표시되고, 프로세스가 그런 메모리를 접근하려고 하면 운영체제에 트랩을 발생시킨다. 운영체제는 그 프로세스를 종료시킬 확률이 높다. Valid bit는 할당되지 않은 주소 공간을 표현하기 위해 반드시 필요하다. 주소 공간의 미사용 페이지를 모두 표시함으로써 이러한 페이지들에게 물리 프레임을 할당할 필요를 없애 대량의 메모리를 절약한다.
페이지가 읽을 수 있는지, 쓸 수 있는지, 또는 실행될 수 있는지를 표시하는 Protection bit가 있다. Protection bit가 허용하지 않는 방식으로 페이지에 접근하려고 하면 운영체제에 트랩을 생성한다.
중요하지만 당장은 다루지 않는 몇 가지 다른 비트가 있다. Present bit는 이 페이지가 물리 메모리에 있는지 혹은 디스크에 있는지 가리킨다. 이런 기본적인 기법들은 나중에 물리 메모리보다 더 큰 주소 공간을 지원하기 위하여 주소 공간의 일부를 스왑하는 방법에 대해 배울 때 좀 더 자세히 이해할 것이다. 스와핑은 운영체제가 드물게 사용되는 페이지를 디스크로 이동시켜 물리 메모리를 비울 수 있게 한다. Dirty bit 또한 일반적인데, 메모리에 반입된 후 페이지가 변경되었는지 여부를 나타낸다.
Reference bit(또는 Accessed bit)는 때때로 페이지가 접근되었는지를 추적하기 위해 사용된다. 또한, 어떤 페이지가 인기가 있는지 결정하여 메모리에 유지되어야 하는 페이지를 결정하는 데에도 유용하다. 이 정보는 페이지 교체에 매우 중요하다. 페이지 교체에 대해서는 이후의 장에서 자세히 다룬다.
위 그림은 x86 아키텍처의 페이지 테이블 항목을 보여준다. 여기서 R/W는 페이지에 쓰기가 허용되는지 결정하는 읽기/쓰기 비트이고, U/S는 사용자 모드 프로세스가 페이지에 액세스 할 수 있는지를 결정하는 사용자/슈퍼바이저 비트, 그리고 페이지에 대한 하드웨어 캐시의 동작을 결정하는 몇몇 비트(PWT, PCD, PAT 및 G)들이 있다. 언급하지 않았던 것들은 위에서 살펴봤으므로 생략한다.
페이징 : 너무 느림
페이지 테이블의 크기가 메모리 상에서 매우 크게 증가할 수 있다. 페이지 테이블로 인해 처리 속도가 저하될 수 있다. 간단한 명령어를 예로 들어보자.
movl 21, %eax
주소 21에 대한 참조만 고려하고 명령어 반입에 대해서는 고려하지 않기로 하자. 이 예에서 하드웨어가 주소 변환을 담당한다고 가정한다. 원하는 데이터를 가져 오기 위해, 먼저 시스템은 가상 주소(21)를 정확한 물리적 주소(117)로 변환해야 한다. 주소 117에서 데이터를 반입하기 전에 시스템은 프로세스의 페이지 테이블에서 적절한 페이지 테이블 항목(PTE)을 가져와야 하고, 변환을 수행한 후, 물리 메모리에서 데이터를 탑재한다.
이렇게 하기 위해서, 하드웨어는 현재 실행 중인 프로세스의 페이지 테이블의 위치를 알아야 한다. 당분간 하나의 페이지 테이블 베이스 레지스터(Page table base register)가 페이지 테이블의 시작 주소(물리 주소)를 저장한다고 가정한다. 원하는 PTE의 위치를 찾기 위해 하드웨어는 다음과 같은 연산을 수행한다.
VPN = (VirtualAddress & VPN_MASK) >> SHIFT
PTEAddr = PageTableBaseRegister + (VPN * sizeof(PTE))
이 예제에서 VPN_MASK는 0x30(이진수로 110000)으로 설정되고 전체 가상 주소에서 VPN 비트만 골라낸다. SHIFT는 4로 설정되고(오프셋 비트 수), 올바른 정수 가상 페이지 번호를 형성하기 위해 VPN 비트를 오른쪽으로 이동시킨다. 가상 주소 21(010101)을 마스킹 하면 010000이 되고 쉬프트는 01 또는 우리가 원하는 가상 페이지 1로 변환한다. 우리는 이 값을 페이지 테이블 베이스 레지스터가 가리키는 PTE 배열에 대한 인덱스로 사용한다.
이 물리 주소가 알려지면 하드웨어는 메모리에서 PTE를 반입할 수 있고, PFN을 추출하고, 가상 주소의 오프셋과 연결하여 원하는 물리 주소를 만든다. 구체적으로, PFN을 SHIFT 만큼 왼쪽으로 쉬프트 하고 오프셋과 논리적 OR 연산을 하여 최종 주소를 형성한다고 생각할 수 있다.
offset = VirtualAddress & OFFSET_MASK
PhysAddr = (PFN << SHIFT) | offset
마지막으로, 하드웨어는 메모리에서 원하는 데이터를 가져와서 eax 레지스터에 넣을 수 있다. 이제 프로그램은 메모리로부터 값을 성공적으로 탑재하였다.
정리를 위하여, 각 메모리 참조 시 일어나는 세부 동작들을 살펴보자. 다음 그림은 기본적인 방식을 보여준다.
모든 메모리 참조에 대해 먼저 페이지 테이블에서 변환 정보를 반입해야 하기 때문에 반드시 한 번의 추가적인 메모리 참조가 필요하다. 엄청난 양의 작업이다. 메모리 참조는 비용이 비싸고 이 경우에 프로세스는 2배 이상 느려진다.
반드시 해결해야 할 두 개의 진짜 문제(느림, 메모리 낭비)를 알게 되었다. 하드웨어와 소프트웨어의 신중한 설계 없이는 페이지 테이블로 인해 시스템이 매우 느려질 수 있으며 너무 많은 메모리를 차지한다. 페이징이 메모리 가상화에 필요한 훌륭한 해결책처럼 보이지만 먼저 이 두 가지 중요한 문제가 해결되어야 한다.
메모리 트레이스
간단한 메모리 액세스 예를 통해 페이징을 사용했을 때 발생하는 모든 메모리 접근을 살펴보자. 우리가 관심있는 코드는 다음과 같다. 또한 이 코드를 컴파일하고 다음과 같이 실행한다.
이 코드가 어떤 메모리 접근을 생성할지에 대해서 진짜로 이해하려면 몇 가지 사실을 더 알아야 한다. 먼저, 루프 안에서 배열을 초기화하기 위해 어떤 어셈블리 명령어를 사용하는지 보기 위하여 결과 이진 파일을 디스어셈블(Disassemble) 해야만 한다. 다음은 결과 어셈블리 코드이다.
첫번째 명령어는 값 0을 가상 메모리 주소로 옮긴다. 0 값이 저장될 가상 메모리 주소는 %edi의 값을 %eax의 4배에다 더해서 계산된다. %edi는 배열의 시작 주소를 저장하고, %eax는 배열 인덱스(i)를 저장한다. 배열이 정수 배열이고 정수의 크기는 4바이트이기 때문에 4를 곱한다.
두번째 명령어는 %eax에 저장된 배열 인덱스를 증가시키고, 세번째 명령어는 %eax의 값과 16진수 0x03e8 또는 십진수 1000을 비교한다. 비교 결과 아직 두 값이 같지 않다면, 네번째 명령어는 루프의 상단으로 다시 분기한다.
이 명령어 시퀀스가 어떤 메모리 접근을 생성하는지 이해하기 위해서, 코드와 배열의 가상 메모리의 주소와 페이지 테이블의 위치에 대해서 몇 가지 가정을 해야 한다.
이 예에서 크기가 64KB인 가상 주소 공간을 가정한다. 또 페이지 크기는 1KB로 가정한다. 우리가 알아야 할 것은 페이지 테이블의 내용과 위치이다. 선형 페이지 테이블이고 물리 주소 1KB에 위치한다고 가정하자.
이 예에서 신경 써야 할 몇 개의 페이지 테이블의 페이지가 있다. 첫째, 코드가 상주하는 가상 페이지가 있다. 페이지 크기가 1KB이기 때문에, 가상 주소 1024는 가상 주소 공간의 두 번째 페이지에 상주한다.(VPN = 1, VPN = 0은 첫번째 페이지) 이 가상 페이지가 물리 프레임(4)에 매핑된다고 가정하자.(VPN 1 -> PFN 4)
다음으로 배열 자체가 있다. 크기는 4000바이트(1000개의 정수)이고, 가상 주소 40000에서 44000까지 존재한다고 가정한다. 이 범위에 해당하는 가상 페이지는 VPN = 39 ... VPN = 42이다. 우리는 이 페이지에 대한 매핑이 필요하다. 이 가상-대-물리 주소 매핑이 다음과 같다고 가정하자 : (VPN 39 -> PFN 7) (VPN 40 -> PFN 8) (VPN 41 -> PFN 9) (VPN 42 -> PFN 10)
이제 프로그램의 메모리 참조를 살펴볼 준비가 되었다. 프로그램이 실행되면, 각 명령어의 반입 시에 메모리가 두 번 참조한다.(명령어의 위치 파악을 위해 페이지 테이블 접근 한 번, 그리고 명령어 자체에 한 번) 게다가 mov 명령어는 메모리 참조를 한 번 한다. 이 명령도 먼저 페이지 테이블 접근 한 번(배열의 가상 주소를 올바른 물리 메모리 주소로 변환하기 위하여), 다음 배열 자체를 접근하기 위하여 한 번의 참조가 필요하다.
처음 다섯 번의 루프 반복에 대해 전체 과정이 위 그림에 나와 있다. 가장 아래쪽 그래프가 명령어 메모리 참조다. (왼쪽 : 가상주소, 오른쪽 : 물리주소) 중앙의 그래프는 배열에 대한 접근이다. 마지막으로, 맨 위의 그래프는 페이지 테이블 메모리 접근이다.(이 예에서 페이지 테이블은 물리적 메모리만 존재한다) 전체 트레이즈세어, x축은 루프가 처음 다섯 번 반복되는 과정에서의 메모리 접근을 보인다. 루프당 10번의 메모리 접근이 존재한다. 네 번의 명령어 반입, 한 번의 메모리 갱신, 그리고 이러한 네 번의 반입과 한 번의 명시적인 갱신을 위한 주소 변환을 위한 총 다섯 번의 페이지 테이블 접근 등이다.
간단한 몇 줄 안되는 코드를 보았지만, 실제 응용 프로그램의 메모리 동작이 얼마나 복잡한 일인지 알았을 것이다.
'OS' 카테고리의 다른 글
2-13장. 페이징 : 더 작은 테이블 (0) | 2020.03.30 |
---|---|
2-12장. 페이징 : 더 빠른 변환(TLB) (0) | 2020.03.21 |
2-10장. 빈 공간 관리(메모리) (0) | 2020.03.18 |
2-9장. 세그멘테이션 (0) | 2020.03.13 |
2-8장. 주소 변환의 원리 (0) | 2020.03.09 |