\(@^0^@)/

[BOOK] 운영체제와 컴퓨터, 메모리 본문

BOOKS/면접을 위한 CS 전공지식 노트

[BOOK] 운영체제와 컴퓨터, 메모리

minjuuu 2023. 4. 28. 20:35
728x90
  • 컴퓨터는 운영체제, CPU, 메모리 등으로 이루어져 있다.
    • 운영체제 : 소프트웨어(유저 프로그램)를 관리하는 일꾼
    • CPU
    • 메모리

 


  • 운영체제의 역할과 구조
  • 운영체제의 역할
    1. CPU 스케줄링과 프로세스 관리 : CPU 소유권을 어떤 프로세스에 할당할지, 프로세스의 생성과 삭제, 자원 할당 및 반환을 관리한다.
    2. 메모리 관리 : 한정된 메모리를 어떤 프로세스에 얼마큼 할당해야 하는지 관리한다.
    3. 디스크 파일 관리 : 디스크 파일을 어떠한 방법으로 보관할지 관리한다.
    4. I/O 디바이스 관리 : I/O 디바이스들인 마우스, 키보드와 컴퓨터 간에 데이터를 주고받는 것을 관리한다.

 

  • 운영체제의 구조
    • 유저 프로그램이 맨 위에 있고 GUI, 시스템콜, 커널, 드라이버가 있으며 가장 밑에 하드웨어가 있는 구조.
      GUI, 시스템콜, 커널 드라이버 부분을 운영체제라고 한다.
      GUI가 없고 CUI만 있는 리눅스 서버도 있다.
      • GUI : 사용자가 전자장치와 상호 작용할 수 있도록 하는 사용자 인터페이스의 한 형태, 단순 명령어 창이 아닌 아이콘을 마우스로 클릭하는 단순한 동작으로 컴퓨터와 상호 작용할 수 있도록 해준다.
      • 드라이버 : 하드웨어를 제어하기 위한 소프트웨어
      • CUI : 그래픽이 아닌 명령어로 처리하는 인터페이스 
    • 시스템콜
      • 운영체제가 커널에 접근하기 위한 인터페이스
      • 유저 프로그램이 운영체제의 서비스를 받기 위해 커널 함수를 호출할 때 쓴다.
      • 유저 프로그램이 I/O 요청으로 트랩(trap)을 발동하면 올바른 I/O 요청인지 확인한 후 유저 모드가 시스템콜을 통해 커널 모드로 변환되어 실행된다.
        • I/O 요청 : 입출력 함수, 데이터베이스, 네트워크, 파일 접근 등에 관한 일
      • 컴퓨터 자원에 대한 직접 접근을 차단할 수 있고 프로그램을 다른 프로그램으로부터 보호할 수 있다.
      • 프로세스나 스레드에서 운영체제로 어떠한 요청을 할 때 시스템콜이라는 인터페이스와 커널을 거쳐 운영체제에 전달된다.
      • 네트워크 통신이나 데이터베이스와 같은 낮은 단계의 영역 처리에 대한 부분을 많이 신경 쓰지 않고 프로그램을 구현할 수 있는 장점이 있다.
    • modebit
      • 시스템콜이 작동될 때 modebit을 참고해서 유저 모드와 커널 모드를 구분한다.
      • 카메라, 키보드 등 I/O 디바이스는 운영체제를 통해서만 작동해야 한다.
      • 커널 모드를 거쳐 운영체제를 통해 작동한다고 해도 100% 막을 수는 없지만, 운영체제를 통해 작동하게 해야 막기가 쉽다.
      • modebit의 0은 커널 모드, 1은 유저 모드라고 설정됨.
        • 유저 모드 : 유저가 접근할 수 있는 영역을 제한적으로 두며 컴퓨터 자원에 함부로 침범하지 못하는 모드
        • 커널 모드 : 모든 컴퓨터 자원에 접근할 수 있는 모드
        • 커널 : 운영체제의 핵심 부분이자 시스템콜 인터페이스를 제공하며 보안, 메모리, 프로세스, 파일 시스템, I/O 디바이스, I/O 요청 관리 등 운영체제의 중추적인 역할을 한다.

  • 컴퓨터의 요소
    • CPU(Central Processing Unit)
      • 산술논리연산장치, 제어장치, 레지스터로 구성되어 있는 컴퓨터 장치
      • 인터럽트에 의해 단순히 메모리에 존재하는 명령어를 해석해서 실행한다.
      • 관리자 역할을 하는 운영체제의 커널이 프로그램을 메모리에 올려 프로세스를 만들면 일꾼인 CPU가 이를 처리한다.
      • 제어장치(CU, Control Unit)
        • 프로세스 조작을 지시하는 CPU의 한 부품
        • 입출력장치 간 통신을 제어하고 명령어들을 읽고 해석하며 데이터 처리를 위한 순서를 결정한다.
      • 레지스터
        • CPU 안에 있는 매우 빠른 임시기억장치
        • CPU와 직접 연결되어 있으므로 연산 속도가 메모리보다 수십 배에서 수백 배까지 빠르다.
        • CPU는 자체적으로 데이터를 저장할 방법이 없기 때문에 레지스터를 거쳐 데이터를 전달한다.
      • 산술논리연산장치(ALU, Arithmetic Logic Unit)
        • 덧셈, 뺄셈 같은 두 숫자의 산술 연산과 배타적 논리합, 논리곱 같은 논리 연산을 계산하는 디지털 회로
        • CPU의 연산 처리*
          1. 제어장치가 메모리에 계산할 값을 로드한다. 또한 레지스터에도 로드한다.
          2. 제어장치가 레지스터에 있는 값을 계산하라고 산술논리연산장치에 명령한다.
          3. 제어장치가 계산된 값을 다시 '레지스터에서 메모리로' 계산한 값을 저장한다.
      • 인터럽트
        • 어떤 신호가 들어왔을 때 CPU를 잠깐 정지시키는 것
        • 키보드, 마우스 등 IO 디바이스로 인한 인터럽트,
          0으로 숫자를 나누는 산술 연산에서의 인터럽트, 프로세스 오류 등으로 발생한다.
        • 하드웨어 인터럽트
          • 키보드를 연결한다거나 마우스를 연결하는 일 등의 IO 디바이스에서 발생하는 인터럽트
        • 소프트웨어 인터럽트
          • 트랩(trap)이라고도 한다.
          • 프로세스 오류 등으로 프로세스가 시스템콜을 호출할 때 발동한다.
      • DMA 컨트롤러
        • I/O 디바이스가 메모리에 직접 접근할 수 있도록 하는 하드웨어 장치
        • CPU에만 너무 많은 인터럽트 요청이 들어오기 때문에 CPU 부하를 막아주며
          CPU의 일을 부담하는 보조 일꾼
        • 하나의 작업을 CPU와 DMA 컨트롤러가 동시에 하는 것을 방지한다.
      • 메모리
        • 전자회로에서 데이터나 상태, 명령어 등을 기록하는 장치
        • RAM(Random Access Memory)을 일컬어 메모리라고 한다.
        • CPU는 계산을 담당하고, 메모리는 기억을 담당한다.
        • 공장에 비유하자면 CPU는 일꾼이고, 메모리는 작업장이며, 작업장의 크기가 곧 메모리의 크기.
          작업장이 클수록 창고에서 물건을 많이 가져다 놓고 많은 일을 할 수 있듯이 메모리가 크면 클수록 많은 일을 동시에 할 수 있다.
      • 타이머
        • 시간이 많이 걸리는 프로그램이 작동할 때 제한을 걸기 위해 존재한다.
      • 디바이스 컨트롤러(device controller)
        • 컴퓨터와 연결되어 있는 IO 디바이스들의 작은 CPU

CPU의 연산 처리


  • CPU는 그저 '메모리'에 올라와 있는 프로그램의 명령어들을 실행할 뿐

  • 메모리 계층
    • 레지스터 : CPU 안에 있는 작은 메모리, 휘발성, 속도 가장 빠름, 기억 용량이 가장 적다.
    • 캐시 : L1, L2, L3 캐시를 지칭한다. 휘발성, 속도 빠름, 기억 용량이 적다.
    • 주기억장치 : RAM을 가리킨다. 휘발성, 속도 보통, 기억 용량이 보통.
    • 보조기억장치 : HDD, SSD를 일컬으며 비휘발성, 속도 낮음, 기억 용량이 많다
    • 램은 하드디스크로부터 일정량의 데이터를 복사해서 임시 저장하고 이를 필요 시마다 CPU에 빠르게 전달하는 역할
    • 계층 위로 올라갈수록 가격은 비싸지는데 용량은 작아지고 속도는 빨라지는 특징이 있다.
    • 캐시(cache)
      • 데이터를 미리 복사해 놓는 임시 저장소이자 빠른 장치와 느린 장치에서 속도 차이에 따른 병목 현상을 줄이기 위한 메모리
      • 데이터를 접근하는 시간이 오래 걸리는 경우를 해결하고 무언가를 다시 계산하는 시간을 절약할 수 있다.
      • 캐싱 계층 : 속도 차이를 해결하기 위해 계층과 계층 사이에 있는 계층
      • 지역성의 원리
        • 캐시를 직접 설정할 때는 자주 사용하는 데이터를 기반으로 설정해야 한다.
        • 시간 지역성 : 최근 사용한 데이터에 다시 접근하려는 특성
        • 공간 지역성 : 최근 접근한 데이터를 이루고 있는 공간이나 그 가까운 공간에 접근하는 특성
    • 캐시히트와 캐시미스
      • 캐시히트
        • 캐시에서 원하는 데이터를 찾았을 경우
        • 해당 데이터를 제어장치를 거쳐 가져오게 된다.
        • 위치도 가깝고, CPU 내부 버스를 기반으로 작동하기 때문에 빠르다.
      • 캐시미스
        • 해당 데이터가 캐시에 없다면 주 메모리로 가서 데이터를 찾아오는 것
        • 캐시가 히트되기 위해 매핑하는 방법
        • 레지스터는 주 메모리에 비하면 굉장히 작고 주 메모리는 굉장히 크기 때문에
          작은 레지스터가 캐시 계층으로써 역할을 잘해주려면 이 매핑을 어떻게 하느냐가 중요하다.
          • 직접 매핑(directed mapping)
          • 연관 매핑(associative mapping)
          • 집합 연관 매핑(set associative mapping)
        • 웹 브라우저의 캐시
          • 소프트웨어적인 대표적인 캐시 : 웹 브라우저의 작은 저장소 쿠키, 로컬 스토리지, 세션 스토리지
          • 사용자의 커스텀한 정보나 인증 모듈 관련 사항들을 웹 브라우저에 저장해서 추후 서버에 요청할 때 자신을 나타내는 아이덴티티나 중복 요청 방지를 위해 쓰인다.
          • 쿠키
            • 만료기한이 있는 키-값 저장소
            • 4KB까지 데이터를 저장할 수 있고 만료기한을 정할 수 있다.
            • 쿠키를 설정할 때는 document.cookie로 쿠키를 볼 수 없게 httponly 옵션을 거는 것이 중요하다.
            • 보통 서버에서 만료기한을 정한다.
          • 로컬 스토리지
            • 만료기한이 없는 키-값 저장소
            • 10MB까지 저장할 수 있다.
            • 웹 브라우저를 닫아도 유지되고 도메인 단위로 저장, 생성된다.
            • HTML5를 지원하지 않는 웹 브라우저에서는 사용할 수 없으며 클라이언트에서만 수정 가능하다.
          • 세션 스토리지
            • 만료기한이 없는 키-값 저장소
            • 탭 단위로 세션 스토리지를 생성
            • 탭을 닫을 때 해당 데이터가 삭제된다.
            • 5MB까지 저장 가능하다.
            • HTML5를 지원하지 않는 웹 브라우저에서는 사용할 수 없다.
            • 클라이언트에서만 수정 가능하다.

  • 메모리 관리
    • 운영체제의 대표적인 할 일 중 하나가 메모리 관리
    • 가상 메모리(virtual memory)
      • 컴퓨터가 실제로 이용 가능한 메모리 자원을 추상화하여 이를 사용하는 사용자들에게 매우 큰 메모리로 보이게 만드는 것
      • 가상 주소(logical address) : 가상적으로 주어진 주소
        • 가상 주소는 메모리관리장치(MMU)에 의해 실제 주소로 변환된다.
      • 실제 주소(physical address) : 실제 메모리상에 있는 주소
        • 사용자는 실제 주소를 의식할 필요 없이 프로그램을 구축할 수 있게 된다.
      • 스와핑
        • 메모리에서 당장 사용하지 않는 영역을 하드디스크로 옮기고 하드디스크의 일부분을 마치 메모리처럼 불러와 쓰는 것을 스와핑(swapping)이라고 한다.
      • 페이지 폴트
        • 프로세스의 주소 공간에는 존재하지만 지금 이 컴퓨터의 RAM에는 없는 데이터에 접근했을 경우에 발생한다.
        • 페이지 폴트와 그로 인한 스와핑 과정
          1. CPU는 물리 메모리를 확인하여 해당 페이지가 없으면 트랩을 발생해서 운영체제에 알린다.
          2. 운영체제는 CPU의 동작을 잠시 멈춘다.
          3. 운영체제는 페이지 테이블을 확인하여 가상 메모리에 페이지가 존재하는지 확인하고,
            없으면 프로세스를 중단하고 현재 물리 메모리에 비어 있는 프레임이 있는지 찾는다.
            물리 메모리에도 없다면 스와핑이 발동된다.
          4. 비어 있는 프레임에 해당 페이지를 로드하고, 페이지 테이블을 최신화한다.
          5. 중단되었던 CPU를 다시 시작한다.
        • 페이지(page) : 가상 메모리를 사용하는 최소 크기 단위
        • 프레임(frame) : 실제 메모리를 사용하는 최소 크기 단위
      • 스레싱(thrashing)
        • 메모리의 페이지 폴트율이 높은 것을 의미하며, 이는 컴퓨터의 심각한 성능 저하를 초래한다.
        • 메모리에 너무 많은 프로세스가 동시에 올라가게 되면 스와핑이 많이 일어나서 발생하는 것
        • 페이지 폴트가 일어나면 CPU 이용률이 낮아진다.
        • CPU 이용률이 낮아지게 되면 운영체제는 "CPU가 한가한가?"라고 생각하여 가용성을 더 높이기 위해 더 많은 프로세스를 메모리에 올리게 된다.
        • 이를 해결하기 위한 방법으로는
          메모리에 늘리거나, HDD를 사용한다면 HDD를 SSD로 바꾸는 방법이 있다.
        • 작업 세트(working set)
          • 미리 메모리에 로드하면 탐색에 드는 비용을 줄일 수 있고 스와핑 또한 줄일 수 있다.
        • PFF(Page Fault Frequency)
          • 페이지 폴트 빈도를 조절하는 방법으로 상한선과 하한선을 만드는 방법
          • 상한선에 도달한다면 프레임을 늘리고 하한선에 도달한다면 프레임을 줄이는 것
      • 메모리 할당
        • 연속 할당 : 메모리에 '연속적으로' 공간을 할당하는 것 
          • 고정 분할 방식(fixed partition allocation)
            • 메모리를 미리 나누어 관리하는 방식
            • 단점 :
              메모리가 미리 나뉘어 있기 때문에 융통성이 없다.
              내부 단편화 발생.
          • 가변 분할 방식(variable partition allocation)
            • 매 시점 프로그램의 크기에 맞게 동적으로 메모리를 나눠 사용한다.
            • 내부 단편화는 발생하지 않고, 외부 단편화는 발생할 수 있다.
            • 최초적합 : 위쪽이나 아래쪽부터 시작해서 홀을 찾으면 바로 할당한다.
            • 최적적합 : 프로세스의 크기 이상인 공간 중 가장 작은 홀부터 할당한다.
            • 최악적합 : 프로세스의 크기와 가장 많이 차이가 나는 홀에 할당한다.
              • 홀(hole) : 할당할 수 있는 비어 있는 메모리 공간이다.
        • 불연속 할당
          • 현대 운영체제가 쓰는 방법
          • 메모리를 동일한 크기의 페이지(보통 4KB)로 나누고 프로그램마다 페이지 테이블을 두어 이를 통해 메모리에 프로그램을 할당하는 것 
          • 페이징(paging)
            • 동일한 크기의 페이지 단위로 나누어 메모리의 서로 다른 위치에 프로세스를 할당한다.
            • 홀의 크기가 균일하지 않은 문제가 없어지지만 주소 변환이 복잡해진다.
          • 세그멘테이션(segmentation)
            • 페이지 단위가 아닌 의미 단위인 세그먼트(segment)로 나누는 방식
            • 프로세스는 코드, 데이터, 스택, 힙 등으로 이루어지는데
              코드와 데이터 등 이를 기반을 나눌 수도 있으며 함수 단위로 나눌 수도 있음을 의미한다.
            • 공유와 보안 측면에서 좋으며 홀 크기가 균일하지 않은 문제가 발생된다.
          • 페이지드 세그멘테이션(paged segmentation)
            • 공유나 보안을 의미 단위의 세그먼트로 나누고, 물리적 메모리는 페이지로 나누는 것
      • 페이지 교체 알고리즘
        • 오프라인 알고리즘
          • 먼 미래에 참조되는 페이지와 현재 할당하는 페이지를 바꾸는 알고리즘
          • 가장 좋은 방법이지만, 미래에 사용되는 프로세스를 알 수 없어서 사용할 수 없는 알고리즘
        • FIFO(First In First Out) : 가장 먼저 온 페이지를 교체 영역에 가장 먼저 놓는 방법
        • LRU(Least Recentle Used)
          • 참조가 가장 오래된 페이지를 바꾼다
          • '오래된'것을 파악하기 위해 각 페이지마다 계수기, 스택을 두어야 하는 문제점이 있다.
          • 보통 해시 테이블과 이중 연결 리스트로 구현한다.
            • 해시 테이블은 이중 연결 리스트에서 빠르게 찾을 수 있도록 쓰고,
              이중 연결 리스트는 한정된 메모리를 나타낸다.
        • LFU(Least Frequently Used) : 가장 참조 횟수가 적은 페이지를 교체한다.

출처 : 면접을 위한 CS 전공지식 노트

728x90