# Data Structures & Function Arguments

해당 단원에서 다루는 내용들:
- 파이썬에서 제공하는 기본적인 데이터 구조인 리스트(list)와 집합(set)
- 함수에 가변적인 개수의 인수(argument)를 전달하는 방법(variable length argument)과 기본 인수를 설정하는 방법(default argument)
- `collections` 라이브러리에서 제공하는 추가적인 자료 구조들

## List
: 데이터를 순서대로 저장할 수 있는 데이터 구조입니다.

- (거의) 뭐든지 담을 수 있으며,
- 리스트에 담겨 있는 것들은 **인덱스**(index) 라고 하는 번호를 부여받습니다. 인덱스를 이용해서 데이터에 접근할 수 있습니다.

<image src="https://www.scaler.com/topics/media/elements-in-python-list-1024x495.webp" width="600">


### 리스트 사용하기
- `append(x)`: `x`를 리스트 뒤에 추가합니다.
- `pop(i)`: i번째 원소를 제거하고 반환합니다. 인자 i를 생략할 경우 맨 뒤의 원소를 pop합니다.
- `len(l)`: 리스트 `l`의 길이를 반환합니다.
- `sum(l)`: 리스트 `l`에 들어 있는 원소들의 합을 반환합니다.

```python
# []를 사용해 리스트 만들기
l = ["hello", "world"]

# append(x) 메소드 사용하기
l.append("!!!!!!!!!!!!!!")
print(l) # -> ["hello", "world", "!!!!!!!!!!!!!!"]

# pop() 메소드
print(l.pop()) # -> "!!!!!!!!!!!!!!"
print(l) # -> ["hello", "world"]
print(l.pop(0)) # -> "hello"
print(l) # -> ["world"]

# 길이
print(len(l)) # -> 1
```

### 큐(queue)로 활용하기
<image src="https://blog.skiplino.com/hubfs/people-line-up-in-queue.jpg" width="300">

큐는 대기열이라는 뜻으로, 처음 들어온 데이터가 먼저 나가는(FIFO; First In, First Out) 특성을 가지는 자료 구조입니다. 리스트의 `append()`와 `pop(0)` 메소드를 활용해 리스트를 큐로 활용할 수 있습니다.

```python
print_queue = []
print_queue.append("일반화학실험 실험1.pdf")
print_queue.append("CSED101-Lecture09-DataStructures02.pdf")
print_queue.append("프로그래밍과문제해결-24-1-기말-시험지.pdf")

print(print_queue.pop(0))
print(print_queue.pop(0))
print(print_queue)
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    일반화학실험 실험1.pdf
    CSED101-Lecture09-DataStructures02.pdf
    ["프로그래밍과문제해결-24-1-기말-시험지.pdf"]
  </code></pre>
</details>

### 스택(stack)으로 활용하기
<image src="https://qph.cf2.quoracdn.net/main-qimg-b552755113734ae2ade1a3bedb66447c-lq" height="300">

스택(stack)은 더미라는 뜻으로, 나중에 들어온 데이터가 먼저 나가는(LIFO; Last In First Out) 특성을 가지는 자료 구조입니다. 역시 리스트를 스택으로 활용할 수 있습니다.

```python
book_stack = []
book_stack.append("뉴런 미적분")
book_stack.append("Linear Algebra")
book_stack.append("내 이름은 빨강")

print(book_stack.pop())
print(book_stack.pop())
print(book_stack)
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    뉴런 미적분
    Linear Algebra
    ["내 이름은 빨강"]
  </code></pre>
</details>

### 이차원 리스트
리스트는 (거의) "뭐든지" 담을 수 있습니다. 리스트 안에 리스트를 담을 수도 있습니다.

```python
titles = ["Supernova", "How Sweet", "Bubble Gum"]
artists = ["aespa", "NewJeans", "NewJeans"]
likes = [True, False, True]

l = [titles, artists, likes]

print(l[1][2])
```
<details>
  <summary>출력 보기</summary>
  <code>"NewJeans"</code>
</details>

### List Comprehension
List Comprehension을 이용하면, 리스트를 훨씬 간결한 문법을 사용해서 만들 수 있습니다.

예를 들어, 다음 코드는 사용자가 입력하는 숫자 3개를 리스트로 만들어 출력하는 코드를 for loop로 만든 것입니다.
```python
x = []
for _ in range(3):
    x.append(int(input("> ")))
```

이 3줄짜리 코드를 list comprehension을 이용하면 단 한줄로 표현할 수 있습니다.
```python
x = [int(input("> ")) for _ in range(3)]
```
List comprehension을 사용할 때는 리스트를 나타내는 꺽쇠를 열고, 그 안에 리스트에 들어갈 값(초록색)을 쓴 뒤 for loop 문(파란색)을 작성합니다.

<image src="https://storage.googleapis.com/images-2kfiodw12/9_1.png" style="width: 40%;">

#### Filtering
List comprehension 구문에 if 문을 같이 사용하면 원하는 조건을 만족하는 값들만 리스트에 담을 수 있습니다. 이때 if문은 for문 뒤에 옵니다.
```python
print([i for i in range(5)])
print([i for i in range(5) if i % 2 == 0])
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    [0, 1, 2, 3, 4]
    [0, 2, 4]
  </code></pre>
</details>

#### nested for loop
list comprehension 구문 안에서 for loop를 여러 개 사용하는 것도 가능합니다. for 문의 순서는 list comprehension 없이 코드를 작성했을 때와 동일한 순서로 써줍니다.

```python
x = [0, 2]
y = [2, 4]

z = [x[i] * y[j] for i in range(len(x)) for j in range(len(y))]
print(z)
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    [0, 0, 4, 8]
  </code></pre>
</details>

#### nested list comprehension
```python
l1 = ['A', 'B']
l2 = ['D', 'E']

# x가 먼저 결정되고, 그 다음으로 y가 결정된다
l3 = [x + y for x in l1 for y in l2]

# y가 먼저 결정되고, 그 다음으로 y가 결정된다
l4 = [[x + y for x in l1] for y in l2]
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    ['AD', 'AE', 'BD', 'BE]
    ['AD', 'BD', 'AE', 'BE']
  </code></pre>
</details>


### 체크
다음 코드의 실행 결과는?


In [None]:
l1 = [0, 1, 2]
l2 = [3, 4]

l = [[i * (x + y) for i in range(5)] for x in l1 for y in l2 if l1 != 0]
print(l)

[[0, 3, 6, 9, 12], [0, 4, 8, 12, 16], [0, 4, 8, 12, 16], [0, 5, 10, 15, 20], [0, 5, 10, 15, 20], [0, 6, 12, 18, 24]]


## Set
: = 수학의 집합. 순서가 없으며, 중복된 원소를 허용하지 않는 데이터 구조입니다.

집합 생성: `{0, 1, 2}` OR `set()`

### 삽입 및 삭제
- `add(x)`: 집합에 원소 x를 추가합니다. 이미 원소 x가 존재할 시 아무 일도 하지 않습니다.
- `update(other)`: other의 모든 값들을 원소로 추가합니다.
- `remove(x)`: 원소 x를 제거합니다. 원소 x가 존재하지 않을 시 오류가 발생합니다.
- `discard(x)`: 원소 x가 있으면 제거하고, 없으면 아무 일도 하지 않습니다.
- `clear()`: 모든 원소를 삭제합니다.

### 집합 연산
- `union(s)` / `| s`: 집합 s와의 합집합을 새로 만들어 반환합니다.
- `intersection(s)` / ` & s`: 교집합을 반환합니다.
- `difference(s)` / ` - s`: 차집합을 반환합니다.

### 체크
다음 코드의 실행 결과는?

In [None]:
s1 = {1, 2, 4}
s2 = set()

s1.add(5)

l = [i for i in range(5)]
s2.update(l)
s2.discard(5)

s2 - s1

{0, 3}

## Function Argumnets

### Default Arguments
: 함수 호출 시 매개변수에 값이 지정되지 않을 경우 사용할 기본값

다음과 같이 매개변수에 기본값을 지정해줄 수 있습니다. 기본값이 있는 매개변수는 생략할 수 있으며, 생략된 경우 지정된 기본값이 해당 매개변수에 들어갑니다.
```python
def print_name(first, second = 'Kim'):
  print('My name is', second, first)

print_name('Junseong')
print_name('Junseong', 'Kang')
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    My name is Junseong Kim
    My name is Junseong Kang
  </code></pre>
</details>

어떤 매개변수가 기본값을 가지면, 해당 매개변수 뒤에 오는 매개변수는 반드시 기본값을 가져야 합니다. (이는 호출자의 입장에서 생각해보면 당연합니다.)
```python
def print_name(first = 'Junseong', second):
  ...

# print_name('Kim') -> first가 'Kim'인지, second가 'Kim'인지 모호함
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    SyntaxError: parameter without a default follows parameter with a default
  </code></pre>
</details>

앞에서 리스트를 사용해서 stack/queue를 구현할 때 사용한 `pop()` 함수도 인자에 기본값을 사용하기 때문에 첫 번째 인자를 생략 가능합니다.

```python
# pop()은 대충 이렇게 생김:
def pop(i=None):
  if i is None:
    pop(len(l) - 1)
  else:
    # i번째 원소를 빼기
    ...
```

### Keyword Argument
함수 호출 시 인자의 이름을 명시해서 값을 지정해줄 수 있습니다.
```python
def calc(x, y=0, z=0):
  return x + y + z

print(calc(y=20, x=10))
print(calc(10, y=30, z=20))
print(calc(10, 30, y=20))
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    30
    60
    TypeError: calc() got multiple values for argument 'y'
  </code></pre>
</details>

### Variable Length Argument
매개변수가 몇 개인지 모를 경우, `*x`와 같이 가변 매개변수를 이용할 수 있습니다. `*x`가 i번째 매개변수이면, `x`는 i부터 끝까지 모든 인자들을 담고 있는 리스트로 초기화됩니다.

```python
def product(x, *args):
  for c in args:
    x *= c;
  return x

print(product(10, 1, 2, 4))
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    80
  </code></pre>
</details>

가변 매개변수는 하나만 사용 가능하며, 뒤에는 일반 매개변수가 올 수 없습니다.
```python
def f1(a, *b): # 정상
def f2(a, *b, c): # 에러
def f3(*a, *b): # 에러
def f4(a, b, *c):
```

키워드 가변 인수를 이용하면, 임의의 개수의 키워드 인수를 받을 수 있습니다. `**kwargs`로 선언하며, `kwargs`은 인자를 키로, 인수를 값으로 하는 딕셔너리(dictionary)로 초기화됩니다.
```python
def introduce(name, male=True, **kwargs):
  print("hello, my name is", name)
  print("gender:", "man" if male else "woman")

  for k, v in kwargs.entries():
    print(k, ":", v)

introduce("junseong", male=False, age=21, department="무은재학부")
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    hello, my name is junseong
    gender: man
    age: 21
    department: 무은재학부
  </code></pre>
</details>

## 기타 - Collection & zip

### Collections
`collections`는 파이썬 내장 모듈로, 기본적으로 제공되지 않는 다양한 데이터 타입들을 해당 모듈에서 불러올 수 있습니다.

- `deque`: 양쪽 끝에서 삽입과 삭제가 가능한 데이터 타입

```python
from collections import deque

q = deque([1, 2, 3])
print(queue)

queue.append(4)
queue.append(5)
print(queue)

queue.popleft()
print(queue)

queue.pop()   
print(queue)
```

- `Counter`: 데이터 값의 개수를 새어 주는 딕셔너리

```python
from collections import Counter
counter = Counter(['apple', 'banana', 'cherry', 'apple', 'cherry', 'apple', 'banana'])
print(counter)
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    Counter({'apple': 3, 'banana': 2, 'cherry': 2})
  </code></pre>
</details>

### zip()
`zip()`은 n개의 iterable 객체(값을 차례대로 꺼낼 수 있는 객체. 대표적으로 리스트나 딕셔너리 등)들을 인자로 받아, 길이 n짜리 튜플들을 만들어냅니다.

```python
l1 = [1, 2, 3]
l2 = [4, 5, 6]
print(list(zip(l1, l1, l2, l2))
```
<details>
  <summary>출력 보기</summary>
  <pre><code>
    [(1, 1, 4, 4), (2, 2, 5, 5), (3, 3, 6, 6)]
  </code></pre>
</details>

이를 응용해서 두 리스트를 딕셔너리로 손쉽게 바꿀 수 있습니다.

`dict()` 함수에 인자로 `(키, 값)` 쌍의 리스트를 넣어주는 방식으로도 리스트를 만들 수 있기 때문에, 해당 인자에 키와 값 두 리스트를 `zip()`한 것을 넣어주면 원하는 키와 값을 가지는 딕셔너리가 생성됩니다.
```python
# 아래 d, d2, d3는 모두 동일합니다.
d = dict([
  ('고양이', 100),
  ('강아지', 50),
  ('바퀴벌래', -10000)
])

d2 = {
  '고양이': 100,
  '강아지': 50,
  '바퀴벌래', -10000
}

animals = ['고양이', '강아지', '바퀴벌래']
preferences = [100, 50, -10000]
d3 = dict(zip(animals, preferences))
```