문자열
유니코드는 무엇인가?
유니코드는(Unicode)는 유니코드 협회(Unicode Consortium)가 제정하는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 무자를 다루기 위한 알고리즘 등을 포함하고 있다.
유니코드가 탄생하기 이전에는 같은 한글이 적힌 텍스트 파일이라도 표현하는 방법이 제각각이었다. 어떤 파일이 지원하지 않는 다른 인코딩 형식으로 저장되어 있는 경우에는 파일을 제대로 불러올 수 없었다. 기본적으로 유니코드의 목적은 현존하는 문자 인코딩 방법을 모두 유니코드로 교체하는 것이다.
인코딩(부호화)이란?
인코딩은 어떤 문자나 기호를 컴퓨터가 이용할 수 있는 신호로 만드는 것이다.
이 신호를 입력하는 인코딩과 문자를 해독하는 디코딩을 하기 위해서는 미리 정해진 기준을 바탕으로 입력해독이 처리되어야 한다.
이렇게 인코딩과 디코딩의 기준을 문자열 세트 또는 문자셋(charset)이라고 한다. 이 문자셋의 국제 표준이 유니코드이다.
ASCII 문자는 무엇인가?
영문 알파벳을 사용하는 대표적인 문자 인코딩으로 7비트로 모든 영어 알파벳을 표현할 수 있다. 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수 문자, 그리고 하나의 공백 문자를 포함한다. 유니코드는 ASCII를 확장한 형태이다.
UTF-8, UTF-16은 무엇인가?
UTF-8, UTF-16 같은 것을 자주 볼 수 있다. 이것은 인코딩 방식을 의미한다. UTF-8은 Universal Coded Character Set Transformation Format - 8bit의 약자로, UTF- 뒤에 나오는 숫자는 비트를 나타낸다.
UTF-8의 특징
- 가변 길이 인코딩
- 바이트 순서가 고정
UTF-16의 특징
- 코드 그대로 바이트로 표현 가능
- 바이트 순서가 다양함
한글은 UTF-8에서 3바이트, UTF-16에서 2바이트를 차지한다.
그래픽
비트맵(래스터)와 벡터 이미지의 차이점
비트맵(래스터) | 벡터 | |
기반 기술 | 픽셀 | 수학적으로 계산된 Shape |
특징 | 사진과 같이 색상이 조합이 다양한 이미지에 적합 | 로고, 일러스트와 같이 제품에 적용되는 이미지에 적합 |
확대 | 확대에 적합하지 않고, 보다 큰 사이즈의 이미지가 필요할 때 사용하려는 크기 이상으로 생성하거나 스캔해야 함 | 품질 저하없이 모든 크기로 확대 가능하고, 해상도의 영향을 받지 않음 |
크기(dimension)에 따른 파일 용량(file size) | 큰 크기의 이미지는 큰 파일 사이즈를 가짐 | 큰 크기의 벡터 그래픽은 작은 파일 사이즈를 유지할 수 있음 |
상호 변환 | 이미지의 복잡도에 따라 벡터로 변환하는 것에 오랜 시간이 걸림 | 쉽게 래스터 이미지로 변환 가능 |
대표적인 파일 포멧 | jpg, gif, png, bmp, psd | svg, ai |
웹에서의 사용성 | jpg, gif, png 등이 널리 쓰임 | svg 포켓은 현대의 브라우저에서 대부분 지원 |
운영체제
컴퓨터나 스마트폰의 기기 그 자체(하드웨어)는 스스로 할 수 있는 일이 없다. 하드웨어의 설계를 바탕으로 하드웨어에게 일을 시켜야만 그 의미가 있다. 하드웨어에게 일을 시키는 주체가 바로 운영체제이다.
시스템 자원관리
운영체제가 없다면 응용 프로그램이 실행될 수 없다. 응용 프로그램은 컴퓨터를 이용해 다양한 작업을 하는 것이 목적이고, 운영체제는 응용 프로그램이 하드웨어에게 일을 시킬 수 있도록 도와준다. 하드웨러를 구성하는 일을 하는 CPU, 자료를 저장하는 RAM, 디스크 등의 시스템 자원을 관리하는 주체가 운영체제이다.
- 프로세스 관리(CPU)
- 메모리 관리
- I/O(입출력) 관리(디스크, 네트워크등)
응용 프로그램 관리
응용 프로그램은 권한에 대한 관리가 필요하다.
- 응용 프로그램이 실행되고, 시스템 자원을 사용할 수 있도록 권한과 사용자를 관리한다.
응용 프로그램
응용 프로그램이 운영체제를 통해 컴퓨터에게 일을 시키려면, 컴퓨터를 조작할 수 있는 권한을 운영체제로부터 부여받아야 한다. 권한을 부여받고 난 후에는, 운영체제가 제공하는 기능을 이용할 수 있다. 응용 프로그램이 운영체제와 소통하기 위해서는, 운영체제가 응용 프로그램을 위해 인터페이스(API)를 제공해야 한다. 응용 프로그램이 시스템 자원을 사용할 수 있도록, 운영체제 차원에서 다양한 함수를 제공하는 것을 시스템 콜(System call)이라고 한다.
프로세스, 스레드, 멀티 스레드
1. 프로세스(Process)
운영체제에서는 실행 중인 하나의 애플리케이션을 프로세스라고 부른다. 사용자가 애플리케이션을 실행하면, 운영체제로부터 실행에 필요한 메모리를 할당 받아 애플리케이션의 코드를 실행한다. 이때 실행되는 애플리케이션을 프로세스라고 부르다.
예를 들어 Chrome 브라우저를 두 개 실행하면, 두개의 프로세스가 생성되고 하나의 애플리케이션은 다중 프로세르를 만들기도 한다.
2. 스레드(Thread)
스레드는 사전적으로 한 가닥의 실이라는 뜻이고, 한 가지 작업을 실행하기 위해 순차적으로 실행한 코드를 실처럼 이어 놓았다고 해서 유래됐다. 하나의 스레드는 코드가 실행되는 하나의 흐름이기 때문에, 한 프로세스 내에 스레드가 두 개라면 코드가 실행되는 흐름이 두 개 생긴다.
3. 멀티 스레드(Multi-Thread)
멀티 프로세스가 애플리케이션 단위의 멀티 태스킹이라면, 멀티 스레드는 애플리케이션 내부에서의 멀티 태스킹이라고 할 수 있다.
대용량 데이터의 처리 시간을 줄이기 위해 데이터를 분할하여 병렬로 처리하는 데에 사용할 수도 있고, UI를 자기고 있는 애플리케이션에서 네트워크 통신을 하기 위해 사용할 수도 있다. 그리고 여러 클라이언트의 요청을 처리하는 서버를 개발할 때에도 사용된다.
멀티 스레드
1. 스레드의 특징
- 프로세스 내에서 실행되는 흐름의 단위
- 각 스레드마다 call stack이 존재(call stack: 실행중인 서브루틴을 저장하는 자료 구조)
- 스레드는 다른 스레드와 독립적으로 동작
2. 멀티 스레딩의 장점
프로세스를 이용하여 동시에 처리하던 일을 스레드로 구현할 경우, 메모리 공간과 시스템 자원의 소모가 줄어든다. 스레드 간의 통신이 필요한 경우에도 별도의 자원을 이용하는 것이 아니라, 전역 변수의 공간 또는 동적으로 할당된 공간인 Heap 영역을 이용한다. 따라서 프로세스 간 통신 방법(IPC)에 비해 스레드 간의 통신 방법이 훨씬 간단하다. 시스템 처리량(Throughput)이 향샹되고 자원 소모가 줄어들어 자연스럽게 프로그램의 응답 시간이 단축된다.
3. 멀티 스레딩의 문제점
멀티 프로세스 기반으로 프로그래밍할 때에는 프로세스 간 공유하는 자원이 없다. 따라서 동일한 자원에 동시에 접근하는 일이 없었지만, 멀티 스레딩을 기반으로 프로그래밍할 때에는 공유하는 자원에 대하여 고민이 필요하다. 서로 다른 스레드가 같은 데이터에 접근하고, 힙 영역을 공유하기 때문에 서로 다른 스레드가 서로 사용중인 변수나 자료구조에 접근하여 엉뚱한 값을 읽어오거나 수정하는 일이 발생할 수 있다.
그렇기 때문에 멀티스레딩 환경에서는 동기화 작업이 필요하다. 동기화를 통해 작업 처리 순서를 제어하고, 공유 자원에 대한 접근을 제어해야 한다.
4. 동시성과 병렬성의 차이
동시에 돌릴수 있는 스레드 수는 컴퓨터에 있는 코어 갯수로 제한된다. 운영체제(또는 가상 머신)는 각 스레드를 시간에 따라 분할하여, 여러 스레드가 일정 시간마다 돌아가면서 실행되도록 한다. 이런 방식을 시분할이라고 한다.
- Concurrency(동시성, 병행성): 여러 개의 스레드가 시분할 방식으로 동시에 수행되는 것처럼 착각을 불러 일으킴
- Parallelism(병렬성): 멀티 코어 환경에서 여러 개의 스레드가 실제로 동시에 수행됨
5. Context Switching
다른 태스크(프로세스, 스레드)가 시작할 수 있도록 이미 실행중인 태스크를 멈추는 것을 Context Switching이라고 한다.
코드스테이츠에서 알려주는 컴퓨터 공학이 내가 학교에서 배웠던 것과 많이 다르다. 엄청 축소해 놓은 느낌이다.
'TIL > Code States' 카테고리의 다른 글
Code States 63일차 - [네트워크] 심화 (0) | 2021.10.27 |
---|---|
Code States 62일차 - [컴퓨터공학] 기초 (0) | 2021.10.26 |
Code States 60일차 - [인증/보안] 기초 (0) | 2021.10.22 |
Code State 59일차 - [인증/보안] 기초 (0) | 2021.10.21 |
Code States 58일차 - [인증/보안] 기초 (0) | 2021.10.20 |