'자료구조' 카테고리의 글 목록

자료구조

[자료구조] Linux Kernel Generic Swap 함수 분석 및 구현 2022.02.18
[자료구조] Select sort (선택 정렬) 2020.02.05
[자료구조] Bubble sort (버블 정렬) 2020.02.05

[자료구조] Linux Kernel Generic Swap 함수 분석 및 구현

Gold_engineer 2022. 2. 18. 23:36

2022. 2. 18. 23:36

일반적으로 사용하는 Swap 함수

#include <stdio.h>

void swap(int* a, int* b)
{
    int tmp = *a;

    *a = *b;
    *b = tmp;
}

int main(void)
{
    int x = 1;
    int y = 2;

    swap(&x, &y);
    printf("x(%d), y(%d)\n", x, y);
}

일반적으로 swap() 함수는 위의 코드와 같이 포인터를 사용해서 두 숫자를 바꿔줄 때 사용된다.

일반적인 swap 함수의 문제점

만약 그냥 swap 함수를 사용하게 된다면, 데이터 타입의 변경이 발생했을 때 각각의 타입에 맞춰서 함수를 구현해야하는 치명적인 문제점이 있다.

#include <stdio.h>

void swap(int* a, int* b)
{
    int tmp = *a;

    *a = *b;
    *b = tmp;
}

void swap(double* a, double* b)
{
    int tmp = *a;

    *a = *b;
    *b = tmp;
}

int main(void)
{
    int x = 1, y = 2;
    double dx = 1.1, dy = 2.1;

    swap(&x, &y);
    printf("x(%d), y(%d)\n", x, y);

    swap(&dx, &dy);
    printf("dx(%lf), dy(%lf)\n", dx, dy);
}

예를 들어, 위의 코드처럼 int 타입의 swap 함수와 double 타입의 swap함수를 동시에 구현하였을 때, 함수 이름을 다르게 하지 않으면 C++에서는 오버로딩을 지원하므로 가능하지만, C언어에서는 전부 에러이다. 따라서 네임 맹글링(name mangling)과 같은 방법을 통해 함수 이름도 각각 지원해야하는 불편함이 있다.

#include <stdio.h>

void swap(char* a, char* b, int size)
{
    char tmp;
    int i = 0;

    for (i = 0; i < size; i++) {
        tmp = a[i];
        a[i] = b[i];
        b[i] = tmp;
    }
}

int main(void)
{
    int x = 1, y = 2;
    double dx = 1.1, dy = 2.1;

    swap((char *)&x, (char*)&y, sizeof(x));
    printf("x(%d), y(%d)\n", x, y);

    swap((char*)&dx, (char*)&dy, sizeof(dx));
    printf("dx(%lf), dy(%lf)\n", dx, dy);
}

만약 위의 코드처럼 swap 함수의 네임 맹글링 없이 char *와 size를 사용하여 넘긴다면 warning도 없고, 값도 잘 변경된다. 하지만 위 코드에서의 최대 문제점은 사용자가 swap 함수를 호출할 때마다 필요한 만큼 사이즈를 캐스팅 하는 것인데 이것은 올바르지 않다.

구현된 swap 함수는 이미 char로 받아서 편리하게 프로그래밍 했지만 caller는 매번 casting이 필요한 것은 상당히 불편하기 때문에 이렇게 코딩하면 안 된다. 따라서 swap 함수를 제네릭하게 변경해야 한다.

Generic Swap 함수

void swap(void* a, void* b, int size)
{
    char tmp;
    int i = 0;

    for (i = 0; i < size; i++) {
        tmp = a[i];
        a[i] = b[i];
        b[i] = tmp;
    }
}

따라서 swap 함수의 일반화가 필요하다. 그리고 이 때 사용되는 테크닉이 만능 열쇠인 void pointer이다. void pointer는 캐스팅 없이 받아주는 포인터이다. 그러면 에러가 발생하지도 않고 유저가 쓰기 편하다. 하지만 void pointer를 진짜로 사용하는 것은 문법상 허용되지 않기 때문에 전부 error가 발생한다.

void swap(void* a, void* b, int size)
{
    char tmp;
    int i = 0;
    char* p = (char*)a;
    char* q = (char*)b;

    for (i = 0; i < size; i++) {
        tmp = p[i];
        p[i] = q[i];
        q[i] = tmp;
    }
}

int main(void)
{
    int x = 1, y = 2;
    double dx = 1.1, dy = 2.1;

    swap(&x, &y, sizeof(x));
    printf("x(%d), y(%d)\n", x, y);

    swap(&dx, &dy, sizeof(dx));
    printf("dx(%lf), dy(%lf)\n", dx, dy);
}

void pointer를 사용해도 문법 상 에러가 발생하지 않게 하려면 당연히 char pointer로 캐스팅해서 void pointer의 움직이는 거리를 compiler에게 알려줘야 한다. 이럴 때 구현하는 swap 함수는 복잡해지더라도 호출하는 사용자가 쓰기 편하므로 전체 생산성을 증가시킬 수 있다.

그리고 위의 코드처럼 swap 함수를 사용한다면, 데이터 타입에 대한 에러도 당연히 없고 swap 함수도 문제 없이 수행되므로 모든 타입을 swap 가능한 generic swap 함수가 된다. 그리고 실제로 이 코드는 오픈 소스에서 지원하는 코드이다.

static void generic_swap(void *a, void *b, int size)
{
	char t;
	do {
		t = *(char *)a;
		*(char *)a++ = *(char *)b;
		*(char *)b++ = t;
	} while (--size > 0);
}

Linux Kernel에서 제공하는 lib/sort.c 코드를 보면, 매개변수로 받은 size를 사용하여 do while문을 사용하였다. 연산 퍼포먼스는 Linux Kernel 코드가 조금 더 빠르다.

그 이유는 커널의 size는 감소하면서 0과 비교하는 것이기 때문에 어셈블리 코드 상 flag가 적기 때문이다. 반면에 i가 증가하면서 size가 되는지 조건을 비교하는 것은 연산 측면에서 조금 더 불리하고, 실제로 변수 i는 Linux Kernel 코드에서는 사용하지 않기 때문에 자원을 아낀 측면도 있다. 하지만 Clean code 관점에서 보자면 Linux Kernel 코드는 가독성이 조금 떨어진다.

void sort(void *base, size_t num, size_t size,
	  int (*cmp_func)(const void *, const void *),
	  void (*swap_func)(void *, void *, int size))
{
	/* pre-scale counters for performance */
	int i = (num/2 - 1) * size, n = num * size, c, r;
	if (!swap_func) {
		if (size == 4 && alignment_ok(base, 4))
			swap_func = u32_swap;
		else if (size == 8 && alignment_ok(base, 8))
			swap_func = u64_swap;
		else
			swap_func = generic_swap;
	}
	......
}

결국 핵심은 데이터 타입에 무관한 만능 열쇠인 void pointer를 넘겨 받고 필요한 변수 사이즈를 하나 넘겨서 루프를 돌며 char 별로 데이터들을 각각 swap하는 것이 핵심 테크닉이다. 그리고 이러한 generic swap 함수는 보통 위의 Linux Kernel의 sort 함수처럼 sorting의 내부 알고리즘으로 사용된다.

저작자표시

'자료구조' 카테고리의 다른 글

[자료구조] Select sort (선택 정렬) (0)	2020.02.05
[자료구조] Bubble sort (버블 정렬) (0)	2020.02.05

[자료구조] Select sort (선택 정렬)

Gold_engineer 2020. 2. 5. 21:38

2020. 2. 5. 21:38

Select sort는 개념이 무척 간단하다.

오름차순의 경우 각 step마다 가장 큰 값을 찾아 제일 끝 요소와 자리를 바꾼다.

내림차순의 경우 각 step마다 가장 큰 값을 찾아 제일 첫 요소와 자리를 바꾸면 된다.

그림으로 설명하자면 아래와 같다.

STEP 1) 모든 요소를 검사하여 가장 큰 값을 array[max-1]에 저장한다.

STEP 2) max-1 요소 전까지 검사하여 가장 큰 값을 array[max-2]에 저장한다.

STEP 3) max-2 요소 전까지 검사하여 가장 큰 값을 array[max-3]에 저장한다.

선택 정렬의 경우 시간 복잡도는 O(n^2)이며, 알고리즘이 매우 단순하다.

또한 메모리 이동이 적을 수 있어서 메모리가 제한적인 환경에서 사용하면 성능 상 유리하다.

코드는 아래와 같이 구현 가능하다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
#include <stdio.h>
 
#define MAX_NUM (10)
#define SORT_UP (1)
#define SORT_DOWN (-1)
 
typedef struct _score
{
    int id;
    char name[10];
}SCORE;
 
void print_data(SCORE *d);
void sort_select(SCORE *d, int order);
 
int main(void)
{
    SCORE list[MAX_NUM] = { { 2, "kim" },{ 5, "lee" },{ 1, "park" },{ 7, "kang" },{ 4, "jung" },
    { 10, "su" },{ 9, "won" },{ 6, "ring" },{ 3, "son" },{ 8, "feng" } };
 
    printf("UP sort\n");
    sort_select(list, SORT_UP);
    print_data(list);
 
    printf("\nDOWN sort\n");
    sort_select(list, SORT_DOWN);
    print_data(list);
 
    return 0;
}
 
void sort_select(SCORE *d, int order)
{
    int i, j, k;
    SCORE temp;
 
    for (i = 0; i < MAX_NUM - 1; i++) {
        for (k = 0, j = 1; j < MAX_NUM - i; j++) {
            if ((d[k].id - d[j].id) * order < 0) {
                k = j;
            }
        }
        j--;
 
        if (j != k) {
            temp = d[j];
            d[j] = d[k];
            d[k] = temp;
        }
    }
}
 
void print_data(SCORE *d)
{
    int i = 0;
 
    for (i = 0; i < MAX_NUM; i++) {
        printf("ID(%d) NAME(%s)\n", d[i].id, d[i].name);
    }
}
 
Colored by Color Scripter
cs

이전에 포스팅하였던 bubble sort에서 함수 안에 내용만 위에 설명한대로 수정하였다.

오름차순 및 내림차순에 대한 코드를 작성하였으며, id 기준으로 정렬을 수행한다.

코드 실행 결과는 아래와 같다.

역시 오름차순과 내림차순 모두 잘 정렬된 것을 확인할 수 있다.

위보다 더 효율적인 코드도 구현 가능하지만 기본이 되는 코드이기 때문에 참고하면 좋을 것 같다.

저작자표시

'자료구조' 카테고리의 다른 글

[자료구조] Linux Kernel Generic Swap 함수 분석 및 구현 (0)	2022.02.18
[자료구조] Bubble sort (버블 정렬) (0)	2020.02.05

[자료구조] Bubble sort (버블 정렬)

Gold_engineer 2020. 2. 5. 21:02

2020. 2. 5. 21:02

두 인접한 자료를 비교하여 앞의 데이터가 뒤의 데이터보다 크면 위치를 교환한다.

시간 복잡도는 O(n^2)로 상당히 느리지만, 코드가 단순하여 많이 사용된다.

Bubble sort는 알고리즘 시험을 처음 준비할 때 오름차순 및 내림차순으로 정렬해야 할 문제들을 대비하기 위해 공부하였었는데, 결국 느린 시간복잡도로 인해 다른 정렬 방법으로 바꾼 기억이 난다.

그림으로 설명하자면 아래와 같다.

STEP 1) 첫 요소부터 검사를 진행한다. 인접한 요소와 비교하면서 앞의 요소가 뒤의 요소보다 크면 위치를 교환한다.

STEP 2) 진행

STEP 3) 진행

STEP 4) STEP 1과 같이 앞의 요소가 더 크기 때문에 위치를 교환한다.

STEP 5) 1차 검사 완료

위의 STEP을 반복하며 진행되는데, 1차 검사가 array[max-1]까지 검사하였다면 2차 검사는 array[max-2]까지만 검사를 진행하면 된다.

코드는 아래와 같이 구현 가능하다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
#include <stdio.h>
 
#define MAX_NUM (10)
#define SORT_UP (1)
#define SORT_DOWN (-1)
 
typedef struct _score
{
    int id;
    char name[10];
}SCORE;
 
void print_data(SCORE *d);
void sort_bubble(SCORE *d, int order);
 
int main(void)
{
    SCORE list[MAX_NUM] = { {2, "kim"}, {5, "lee"}, {1, "park"}, {7, "kang"}, {4, "jung"},
                           {10, "su"}, {9, "won"}, {6, "ring"}, {3, "son"}, {8, "feng"} };
 
    printf("UP sort\n");
    sort_bubble(list, SORT_UP);
    print_data(list);
 
    printf("\nDOWN sort\n");
    sort_bubble(list, SORT_DOWN);
    print_data(list);
 
    return 0;
}
 
void sort_bubble(SCORE *d, int order)
{
    int i, j;
    SCORE temp;
 
    for (i = 0; i < MAX_NUM - 1; i++) {
        for (j = 0; j < MAX_NUM - 1 - i; j++) {
            if ((d[j].id - d[j + 1].id) * order > 0) {
                temp = d[j];
                d[j] = d[j + 1];
                d[j + 1] = temp;
            }
        }
    }
}
 
void print_data(SCORE *d)
{
    int i = 0;
 
    for (i = 0; i < MAX_NUM; i++) {
        printf("ID(%d) NAME(%s)\n", d[i].id, d[i].name);
    }
}
Colored by Color Scripter
cs

코드는 10개의 자료로 구성된 배열을 각각 오름차순 및 내림차순으로 정렬한 내용이다.

매크로로 Define된 값에 따라 오름차순과 내림차순을 설정할 수 있으며 기준은 id로 하였다.

코드 실행 결과는 다음과 같다.

오름차순과 내림차순 모두 id 순서대로 정렬이 잘 수행된 것을 확인할 수 있다.

뒤의 name을 기준으로도 정렬 가능하며 strcmp 함수를 이용하여 비교하고 정렬하면 된다.

저작자표시

'자료구조' 카테고리의 다른 글

[자료구조] Linux Kernel Generic Swap 함수 분석 및 구현 (0)	2022.02.18
[자료구조] Select sort (선택 정렬) (0)	2020.02.05

PREV 이전 1 NEXT 다음

Gold_리뷰

자료구조

[자료구조] Linux Kernel Generic Swap 함수 분석 및 구현

일반적으로 사용하는 Swap 함수

일반적인 swap 함수의 문제점

Generic Swap 함수

'자료구조' 카테고리의 다른 글

[자료구조] Select sort (선택 정렬)

'자료구조' 카테고리의 다른 글

[자료구조] Bubble sort (버블 정렬)

'자료구조' 카테고리의 다른 글

+ Recent posts

티스토리툴바