클라이언트: 웹 사용자의 인터넷이 연결된 장치들과 이런 장치들에서 사용 가능한 크롬 같은 웹 브라우저
서버: 웹페이지, 사이트, 앱 등을 저장하는 컴퓨터
웹 -> 도로 클라이언트 -> 우리의 집 서버 -> 상점 라고 생각하고 생각하고 아래 글을 이해하면 쉽습니다.
웹에서 실제로 무슨 일이 일어날까?
우리가 브라우저에 웹 주소를 입력하는 것은 우리가 상점에 걸어가는 것과 비슷합니다.
1. 브라우저는 DNS 서버로 가서 웹사이트 서버의 실제 ip 주소를 찾습니다.
EX) 우리가 네이버 지도로 상점의 주소를 찾는다.
2. 브라우저가 서버에게 웹사이트의 사본을 보내달라는 HTTP 요청 메시지를 서버로 전송합니다. 메시지, 클라이언트와 서버 사이에 전송되는 모든 데이터는 TCP/IP 연결을 통해서 전송됩니다.
EX) 상점에 가서 상품을 주문한다.
3. 이 메시지를 받은 서버는 클라이언트의 요청을 승인하고 "200 OK" 메시지를 클라이언트에게 전송합니다. "200 OK"는 넌 웹사이트를 볼 자격이 있어! 라는 의미입니다. 그 후 서버는 웹사이트의 파일들을 데이터 패킷이라 불리는 작은 덩어리들로 브라우저에 전송을 합니다.
EX) 상점에서 우리가 주문한 상품을 전달받고, 우리는 그 상품을 집으로 가져간다.
4. 브라우저는 이 데이터 패킷들을 완전환 웹 사이트로 조립하고 우리에게 보여줍니다.
EX) 상품이 우리 집 문 앞에 도착한다.
인터넷 연결: 웹에서 데이터를 보내고 받게 해준다.
EX) 집과 상점 사이의 거리
TCP/IP: Transmission Control Protocol(전송 제어 규약) / Internet Protocol(인터넷 규약) -> 데이터가 어떻게 웹을 돌아다닐지 정의하는 통신 규약
EX) 주문을 하고, 상점에 가고, 우리가 상품을 살 수 있게 해주는 운송 장치(우리의 다리 또는 자동차 등등)와 같습니다.
DNS: Domain Name System Servers(도메인 이름 시스템 서버) -> 웹사이트를 위한 주소록
우리가 63.245.217.105 같은 ip 주소를 직접 기억하는 것은 쉽지가 않기에 DNS가 발명되었습니다. DNS는 우리가 브라우저에 입력하는 웹주소 예를 들어 naver.com 같은 웹사이트를 실제 ip 주소에 맞춰주는 특별한 서버입니다.
HTTP: Hypertext Transfer Protocol(하이퍼텍스트 전송 규약)은 클라이언트와 서버가 서로 통신할 수 있게 하기 위한 언어를 정의하는 규약? 약속 같은 친구입니다.
EX) 우리가 상품을 주문하기 위해 사용하는 언어와 같습니다.
packet: 패킷
기본적으로 웹에서 데이터가 전송될 때, 아주 작은 덩어리들로 전송됩니다. 그렇기에 다양한 웹 사용자들이 동시에 같은 웹 사이트를 다운로드할 수 있습니다. 만약 데이터가 하나의 큰 덩어리로 전송된다면, 한 번에 한 명의 사용자만 다운로드가 가능해져서 매우 비효율적이게 됩니다.
전체적으로 봤을 때 로직은 아래와 같이 생각보다 간단하다. 실제로 파일 3개면 구현 가능하다.
int main(int ac, char **av, char **envp)
{
int i;
if (ac != 5)
에러 출력 후 종료
i = -1;
while (++i < 2)
{
if (i == 0)
명령어 파싱 -> 첫 번째 프로세스 실행(infile을 stdin으로 받고 명령어 실행)
else if (i == 1)
명령어 파싱 -> 두 번째 프로세스 실행(첫 번째 프로세스 실행 결과를 stdin으로
받고 명령어 실행 결과를 outfile에 저장)
}
포크된 프로세스 만큼 wait를 해준다. 멘덴토리의 경우에는 2번
i = -1;
while (++i < 2)
wait(NULL);
}
다만 여기서 알고 넘어가야 될게 2가지가 있다. minishell 내용 같긴 한데 pipex 하면서 알고 간다면
minishell 할 때 아주 큰 도움이 된다.
1 ) 쉘에서 명령어들은 병렬로 돌아간다.
예를 들어 sleep 3 | sleep 3은 6초를 기다릴 것 같지만, 실제로는 병렬로 돌기에 3초를 기다린다.
병렬이더라도 cat | cat 같은 경우에는 애초에 앞에서 입력이 들어와야 넘어가기 때문에 프로그램이 끝나지 않는다.
2) 파이프 개수만큼 fork 되는 것이 아니라 파이프 개수 + 1 만큼 fork 된다.
실행되는 명령어가 2개(ls | cat)라서 pipe가 한 개라고 fork를 한번 하지 않는다.
실제로 bash에서 그냥 exit은 당연히 꺼지지만 exit | exit 은 bash가 꺼지지 않는다.
그냥 exit은 fork가 안되고 바로 실행돼서 bash가 꺼지지만, exit | exit의 경우에는 fork가 2번 실행되어서
프로세스가 3개라 bash가 꺼지지 않는다. 이러한 구조를 가지는 것은 자식 프로세스에서 명령어를 수행하고
부모(main) 프로세스에서 모든 자식 프로세스를 기다리게 하기 위함이 아닐까?라고 작성자는 이해했다.
각 프로세스 별로 구현해야 되는 것들을 순서대로 쭉 나열해 보면
1) 첫 번째 프로세스
1.1) infile 읽고 pipe 세팅
자식 프로레스)
infile을 stdin으로 dup2, fd[1]을 stdout으로 dup2 해준다.
여기서 fd[0]만 사용 안 하니까 fd[0]만 close 하는 경우가 많은데, 둘 다 close 해줘야 된다.
fd[0]만 close 하면 yes | head -1 같은 테스트의 경우 프로그램이 끝나지 않는다.
부모 프로레스)
fd[0]을 stdin으로 dup2 해준다. 여기서 fd[0]은 자식 프로세스에서의 명령어 실행 결과가 된다.
결국 첫 번째 명령어의 실행 결과가 stdin으로 들어와 있는 상태라고 생각하면 된다.
여기서도 마찬가지로 fd[0], fd[1] 둘 다 close 해준다.
static void dup_child_1(char **av, int *fd)
{
int infile;
infile = open(av[1], O_RDONLY);
if (infile == -1)
perror_exit("infile error");
if (dup2(infile, STDIN_FILENO) == -1)
perror_exit("dup2 error");
if (dup2(fd[1], STDOUT_FILENO) == -1)
perror_exit("dup2 error");
close(fd[0]);
close(fd[1]);
}
static void child_process_1(char **av, char **envp)
{
int fd[2];
pid_t pid;
if (pipe(fd) == -1)
perror_exit("pipe error");
pid = fork();
if (pid == -1)
perror_exit("fork error");
if (pid == 0)
{
dup_child_1(av, fd);
execute(av[2], envp);
}
if (dup2(fd[0], STDIN_FILENO) == -1)
perror_exit("dup2 error");
close(fd[0]);
close(fd[1]);
}
1.2) 명령어 파싱 후 실행
메인에서 인자로 받는 envp 안에는 이런 식으로 환경변수들이 저장되어 있다.
여기서 우리가 필요한 것은 PATH=/Users/jinhokim/.brew/bin:/Users/jinhokim/.brew/bin:/usr/local/bin:/usr/bin:/
bin:/usr/sbin:/sbin:/usr/local/munki이다. PATH= 뒤의 문자열을 : 기준으로 split 하게 되면
["/bin", "/usr/bin", ...] 같은 결과가 되는데 총 6개의 경로가 나오게 된다. 이 경로들 안에 명령어 파일들이 들어있다.
예를 들어 ls는 /bin/ 안에 들어있는데 그렇기에 쉘에서 /bin/ls를 실행하면 ls가 실행된다.
이제 저 6개의 경로와 첫 번째 명령어를 ft_strjoin한 결과를 access 함수를 통해 실행 가능한 파일인지 확인하고
없는 명령어의 경우에는 에러 출력, 있는 명령어의 경우에는 그냥 execve를 실행해주면 된다.
pipex는 우리가 만들 pipex 프로그램을 위와 같은 방식으로 돌렸을 때, 아래 명령어와 똑같이 동작하도록 구현해야 되는 과제이다.
즉 infile 파일을 읽고 명령어 2개를 실행한 결과를 outfile에 저장해야 된다. 여기서 이 작대기 |가 파이프다.
우리는 이 과제를 통해 프로세스와 프로세스 간 통신을 할 때 사용하는 pipe에 대해 공부해야 한다.
프로세스(process)란?
프로그램은 컴퓨터에서 실행될 때 특정 작업을 수행하는 일련의 명령어들의 집합이다. 이 프로그램의 명령어와
정적 데이터가 메모리에 적재되면 프로세스가 된다. 간단히 말하면 프로세스는 실행 중인 프로그램을 의미한다.
우리가 작업 관리자를 켜면 잔뜩 나오는 것들이 프로세스다.
함수 정리
1. fork
#include <unistd.h>
pid_t fork(void);
fork 함수는 프로세스를 복사해준다. 기존의 프로세스를 부모 프로세스, 복사된 프로세스를 자식 프로세스라고 부른다.
fork 함수는 프로세스의 고유 id인 pid를 반환한다. fork 함수 실행 실패 시 -1을 반환하고 자식 프로세스를 생성하지 않는다.
성공 시에는 부모 프로세스에는 자식 프로세스 피드 값을, 자식 프로세스에는 0이 반환한다.
예시 1)
코드만 보면 if, else문이 다돌아가는 게말이안 되는것 같지만 부모, 자식 프로세스에서 각각 main문이 돌아가기 때문에 2번 출력된다.
int main(void)
{
pid_t pid = fork();
if (pid == 0)
{
printf("Hello from Child\n");
printf("%d %d\n", pid, getpid());
}
else
{
printf("Hello from Parent\n");
printf("%d %d\n", pid, getpid());
}
}
/*
실행 결과
Hello from Parent
48280 48279
Hello from Child
0 48280
*/
예시 2) 자식과 부모 프로세스는 데이터와 상태가 다르기에 변수의 변화가 영향을 끼치지 않는다.
int main(void)
{
int x = 1;
if (fork() == 0)
printf("Child has x = %d\n", ++x);
else
printf("Parent has x = %d\n", --x);
}
/*
실행 결과
Parent has x = 0
Child has x = 2
*/
2. pipe
#include <unistd.h>
int pipe(int fd[2]);
pipe 함수는 파이프를 생성하고 2개의 디스크립터(읽기 전용, 쓰기 전용)를 생성해준다. 실패했을 경우에는 -1을 반환한다.
생성한 2개의 디스크립터와 파이프를 사용해 아래와 같은 방식으로 부모 프로세스를 자식 프로세스를 통신시킬 수 있다.
open 함수를사용할 때와마찬가지로 디스크립터를 사용하기에 pipe 함수 역시 사용하지 않는 디스크립터는 close 함수로 닫아줘야 한다.
부모에서 자식으로 일반통행 방식이기 때문에 부모 프로세스는 읽는 쪽을, 자식 프로세스는 쓰는 쪽을 닫아주면 된다.
예시 1) pipe 생성
int main(void)
{
int fd[2];
pipe(fd);
printf("fd[0]: %d fd[1]: %d\n", fd[0], fd[1]);
}
/*
실행 결과
fd[0]: 3 fd[1]: 4
*/
예시 2) pipe를 사용한 부모와 자식 프로세스 간 통신
#define MAX_BUF 1024
int main()
{
int fd[2];
pid_t pid;
char buf[MAX_BUF];
if (pipe(fd) < 0)
printf("pipe error\n");
pid = fork();
if (pid < 0)
{
printf("fork error\n");
exit(1);
}
if (pid == 0)
{
close(fd[1]);
read(fd[0], buf, MAX_BUF);
printf("Child got message : %s\n", buf);
}
else
{
close(fd[0]);
ft_strcpy(buf, "Massage from Parent");
write(fd[1], buf, ft_strlen(buf));
}
}
/*
실행 결과
Child got message : Massage from Parent
*/
3. wait
#include <sys/wait.h>
pid_t wait(int *statloc);
wait 함수는 자식 프로세스가 종료되었을 때 자식 프로세스의 pid값을 반환하고, 오류가 났을 때는 -1을 반환합니다.
wait 함수를 사용하면 부모 프로세스를 자식 프로세스가 종료될 때까지 기다리게 할 수 있습니다.
만약 자식 프로세스가 종료되었는데 부모 프로세스가 계속 돌아가고 있다면 자식 프로세스는 좀비 프로세스 상태가 되는데
wait 함수를 사용해 이를 방지할 수도 있다.
예시 1) 부모 프로세스가 자식 프로세스가 끝난 후 다시 돌아가는 것을 확인할 수 있다.
int main()
{
int stat, stat_res;
if ((fork()) == 0)
printf("Child Hi\n");
else
{
stat_res = wait(&stat);
printf("Parent Hi\n");
printf("wait 인자값: %d\nwait 반환값: %d\n", stat, stat_res);
wait(NULL);
printf("Child Bye\n");
}
printf("Process Bye\n");
return 0;
}
/*
실행 결과
Child Hi
Process Bye
Parent Hi
wait 인자값: 0
wait 반환값: 57724
Child Bye
Process Bye
*/
아래 WIF 매크로를 사용해서 stat의 정보를 확인할 수 있다.
WIFEXITED(status): 자식 프로세스가 정상적으로 종료했으면 참을 반환한다.
WEXITSTATUS(status): 자식 프로세스의 종료 상태를 반환한다. 이 매크로는WIFEXITED가 참을 반환했을 때만 써야 한다.
int main()
{
int pid, status;
printf("Parent: %d\n", getpid());
pid = fork();
if (pid == 0)
{
printf("Child %d\n", getpid());
sleep(2);
return (0);
}
waitpid(pid, &status, 0);
if (WIFSIGNALED(status))
printf("Error\n");
else if (WEXITSTATUS(status))
printf("Exited Normally\n");
else if (WIFEXITED(status))
printf("Parent: %d\n", getpid());
return 0;
}
4. waitpid
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *statloc, int options);
waitpid 함수는 wait 함수와 거의 똑같은데, 옵션을 추가해 동작 방식을 변경할 수 있다.
아래는 옵션들(3번째 인자 종류)이다. 인자가 0일 경우에는 wait 함수와 동일하게 작동한다.
WNOHANG: 기다리는 PID가 종료되지 않아서 즉시 종료 상태를 회수할 수 없는 상황일 때 0을 반환
WUNTRACED: 중단된 자식 프로세스의 상태를 반환
WCONTINUED: 중단되었다가 재개된 자식 프로세스의 상태를 반환
에시 1) WNOHANG 사용
#include <time.h>
int main()
{
pid_t pid;
int status;
time_t t;
pid = fork();
if (pid < 0)
perror("fork error");
else if (pid == 0)
{
sleep(3);
exit(1);
}
else do
{
pid = waitpid(pid, &status, WNOHANG);
if (pid == -1)
perror("wait error");
else if (pid == 0)
{
time(&t);
printf("child is still running at %s", ctime(&t));
sleep(1);
}
else
{
if (WIFEXITED(status))
printf("child exited with status of %d\n", WEXITSTATUS(status));
else
puts("child did not exit successfully");
}
} while (pid == 0);
}
/*
child is still running at Wed Sep 7 12:27:32 2022
child is still running at Wed Sep 7 12:27:33 2022
child is still running at Wed Sep 7 12:27:34 2022
child exited with status of 1
*/
사실 이 과제에서 WNOHANG을 사용했다는 것은 좋은 징조가 아니다. dup2 후 파이프를 전부 다 닫아주면
WNOHANG을 사용하지 않아도 잘 넘어가진다. 파이프를 잘 안 닫았을 경우 yes | head -1이나
/dev/urandom | head -1 같은 경우에 head 한 결과가 출력도 안되고 프로그램이 끝나지도 않는다.
char *ft_strrchr(const char *s, int c)
{
int i;
i = (int)ft_strlen(s) + 1;
while (i--)
{
if (s[i] == (char)c)
return ((char *)s + i);
}
return (NULL);
}
ft_strtrim: 문자열 s1에서 앞, 뒤에 문자열 set을 자른 문자열을 반환해주는 함수
start = 0 -> s1의 맨 앞에서부터 set 값이 없을 때까지 start 증가
end = ft_strlen(s1) -> s1의 맨 뒤에서부터 set 값이 없을 때까지 end 감소
새 문자열 str에 end - start + 1 만큼의 메모리를 할당해주고 s1의 start부터 end까지의 값들을 복사해주면 된다.
마지막에 null을 넣어주는 것을 잊지 말자!
int ft_setcheck(char c, char const *set)
{
int i;
i = 0;
while (set[i])
{
if (set[i++] == c)
return (1);
}
return (0);
}
char *ft_strtrim(char const *s1, char const *set)
{
char *str;
int start;
int end;
int i;
i = 0;
start = 0;
if (s1 == 0 || set == 0)
return (NULL);
end = (int)ft_strlen(s1);
while (s1[start] && ft_setcheck(s1[start], set))
start++;
while (end > start && ft_setcheck(s1[end - 1], set))
end--;
if (!(str = (char *)malloc(sizeof(char) * (end - start + 1))))
return (NULL);
while (start < end)
str[i++] = s1[start++];
str[i] = '\0';
return (str);
}
ft_substr: 문자열 s의 start번째 인덱스부터 시작하는 크기가 len인 문자열을 반환해주는 함수
start가 문자열 s의 길이보다 크거나 같을 때만 잘 처리해주면 된다. ft_strdup을 사용해서 빈 문자열을 반환해줬다.
char *ft_substr(char const *s, unsigned int start, size_t len)
{
char *str;
size_t i;
i = 0;
if (s == 0)
return (NULL);
if (start >= ft_strlen(s))
return (ft_strdup(""));
if (!(str = (char *)malloc(sizeof(char) * (len + 1))))
return (NULL);
while (s[i] && i < len)
str[i++] = s[start++];
str[i] = 0;
return (str);
}
ft_tolower: 매개변수로 들어오는 값이 대문자면 소문자로 바꿔주는 함수
int ft_tolower(int c)
{
if (c >= 65 && c <= 90)
return (c + 32);
return (c);
}
ft_toupper:매개변수로 들어오는 값이 소문자면 대문자로 바꿔주는 함수
int ft_toupper(int c)
{
if (c >= 97 && c <= 122)
return (c - 32);
return (c);
}
char *ft_strchr(const char *s, int c)
{
int i;
i = 0;
while (i < (int)ft_strlen(s) + 1)
{
if (s[i] == (char)c)
return ((char *)s + i);
i++;
}
return (NULL);
}
ft_strdup: 문자열 s를 복사한 문자열을 반환해주는 함수
새 문자열에 s의 길이 + 1 만큼 할당해주고 s를 그대로 복사해주면 된다. 마지막에 null을 넣어주는 것을 잊지 말자!
char *ft_strdup(const char *s)
{
char *str;
int i;
int slen;
i = 0;
slen = (int)ft_strlen(s);
if (!(str = (char *)malloc(sizeof(*s) * (slen + 1))))
return (NULL);
while (s[i])
{
str[i] = s[i];
i++;
}
str[i] = '\0';
return (str);
}
ft_strjoin: 두 문자열을 s1, s2를 합친 문자열을 반환해주는 함수
새 문자열에 s1의 길이 + s2의 길이 + 1 만큼 할당해주고, s1과 s2를 순서대로 복사해주면 된다.
마지막에 null을 넣어주는 것을 잊지 말자!
char *ft_strjoin(char const *s1, char const *s2)
{
char *str;
int i;
int j;
int s1_len;
int s2_len;
i = 0;
j = 0;
if (s1 == 0 || s2 == 0)
return (NULL);
s1_len = (int)ft_strlen(s1);
s2_len = (int)ft_strlen(s2);
if (!(str = (char *)malloc(sizeof(char) * (s1_len + s2_len + 1))))
return (NULL);
while (i < s1_len)
{
str[i] = s1[i];
i++;
}
while (j < s2_len)
str[i++] = s2[j++];
str[i] = '\0';
return (str);
}
ft_strlcat: 문자열 dst에 문자열 src를 이어 붙이고, 그 길이를 반환하는 함수
dest의 길이가 size보다 크면 size + src의 길이를 반환하고
dest의 길이가 size보다 크지 않으면 dest의 길이 + src길이를 반환해주면 된다.
size_t ft_strlcat(char *dst, const char *src, size_t size)
{
size_t i;
int j;
size_t k;
i = ft_strlen(dst);
j = 0;
if (size < i)
k = size;
else
k = i;
while (src[j] && i < size - 1 && size != 0)
dst[i++] = src[j++];
while (src[j] != '\0')
j++;
dst[i] = '\0';
return (k + j);
}
ft_strlcpy: size만큼 문자열 src를 문자열 dst에 복사하고, src의 크기를 반환해주는 함수
src를 size만큼만 복사해주면 된다.
strlcat 함수도 그렇고 복사해준 src의 길이가 아니라 src의 크기 그 자체를 반환하는 게 조금 아이러니한 것 같다.